Classical mechanics

Classical mechanics

references:

​ [1] 杨望,理论力学讲义
​ [2] H.Goldstein, C. Poole, J.Safko, Classical mechanics , 高等教育出版社
​ [3] 高显,经典力学,科学出版社
​ [4] 金尚年,理论力学(第三版),高等教育出版社


Chapter 0 多元函数的导数和微分

​ 设 f(x1,,xn)f\left(x_1,\dots,x_n\right)nn 个变量 x1,,xnx_1,\dots,x_n 的光滑函数,其中 xiR,1in,f(x1,,xn)Rx_i\in \R,1\leq i\leq n,f\left(x_1,\dots,x_n\right)\in \R .我们采取下述记号,

f[xj]=f(x1,,xn)f[x_j]=f\left(x_1,\dots,x_n\right)

​ 那么偏导数可以写为

fxi[xj]=limϵ0f[xj+ϵδij]f[xj]ϵ(0.1)\frac{\partial f}{\partial x_i}[x_j]=\lim_{\epsilon \to 0}\frac{f[x_j+\epsilon\delta_{ij}]-f[x_j]}{\epsilon}\tag{0.1}

​ 当自变量有如下变换时

x1x1+Δx1,x2x2+Δx2,,xnxn+Δxnx_1\to x_1+\Delta x_1,x_2\to x_2+\Delta x_2,\dots,x_n\to x_n+\Delta x_n

(全)微分可以写成

Δf=f[xj+Δxj]f[xj]=i=1nfxi[xj]Δxi+O(ΔxiΔxj)(0.2)\begin{aligned} \Delta f&=f[x_j+\Delta x_j]-f[x_j]\\ &=\sum_{i=1}^n\frac{\partial f}{\partial x_i}[x_j]\Delta x_i+O\left(\Delta x_i\Delta x_j\right) \end{aligned}\tag{0.2}

Chapter 1 变分法

1.1 泛函

​ 函数就是具体的映射关系

f:ty=f(t)(1.1)f:t\mapsto y=f\left(t\right)\tag{1.1}

1.1.1 泛函的概念

​ 泛函,即函数到数的影射,记函数集合 F={f1,f2,f3,}\mathcal{F}=\{f_1,f_2,f_3,\cdots\} .函数 ff 的泛函记作 S[f]S[f] ,即

fS=S[f],FC(1.2)f\mapsto S=S[f],\quad\mathcal{F}\to \mathbf{C}\tag{1.2}

1.1.2 泛函的具体形式

​ 三维空间中曲面方程记为 z=ϕ(x,y)z=\phi\left(x,y\right) ,则曲面面积 AA 为二元函数 ϕ(x,y)\phi\left(x,y\right) 的泛函

A=A[ϕ]=区域dxdy1+(ϕx)2+(ϕy)2A=A[\phi]=\iint_{区域}\mathrm{d}x\mathrm{d}y\sqrt{1+\left(\frac{\partial\phi}{\partial x}\right)^2+\left(\frac{\partial \phi}{\partial y}\right)^2}

​ 经典力学种所遇到的泛函通常可以写成积分形式:

S[f]=t1t2dtL(t,f(t),f(t),f(t),)(1.3)S[f]=\int_{t_1}^{t_2}\mathrm{d}tL\left(t,f\left(t\right),f'\left(t\right),f''\left(t\right),\cdots\right)\tag{1.3}

这里的被积函数 L=L(t,f(t),f(t),f(t),)L=L\left(t,f\left(t\right),f'\left(t\right),f''\left(t\right),\cdots\right) 是函数 f(t)f\left(t\right) 及其导数的一般函数.

1.2 变分

1.2.1 变分的概念

​ 泛函为函数到数的映射,函数本身的无穷小变化,以及由之引起的泛函的变化即变分.若函数 f(t)f\left(t\right) 变成了另外一个函数 f(t)f~(t)f\left(t\right)\to \tilde{f}\left(t\right) ,且假设两者相差无穷小,则函数 f(t)f\left(t\right) 的变分 δf\delta f 定义为

δf(t):=f~(t)f(t)(1.4)\boxed{\delta f\left(t\right):=\tilde{f}\left(t\right)-f\left(t\right)} \tag{1.4}

​ 函数的变分 δf\delta f 是因为函数本身发生了变化,而与自变量 tt 无关

f(t)f~(t)(f+δf)(t)=f(t)+δf(t)(1.5)f\left(t\right)\to\tilde{f}\left(t\right)\equiv\left(f+\delta f\right)\left(t\right)=f\left(t\right)+\delta f\left(t\right)\tag{1.5}

1.2.2 变分的运算规则

​ 函数的变分和微分同为无穷小变化,形式上的运算规则基本相同.

δ(fn)=nfn1δfδ(af1+bf2)=aδf1+bδf2,δ(f1f2)=(δf1)δf2+δf1(δf2)(1.6)\begin{aligned} &\delta\left(f^n\right)=nf^{n-1}\delta f\\ \delta\left(af_1+bf_2\right)=a\delta f_1&+b\delta f_2,\quad \delta\left(f_1f_2\right)=\left(\delta f_1\right)\delta f_2+\delta f_1\left(\delta f_2\right) \end{aligned}\tag{1.6}

​ 另一个重要且非常有用的性质是,变分和微分可以交换顺序.

δ(df)=d(δf)(1.7)\boxed{\delta\left(\mathrm df\right)=\mathrm d\left(\delta f\right)}\tag{1.7}

proofproof

f~(t+dt)f(t)=f~(t+dt)f~(t)+f~(t)f(t)=δf+df+d(δf)=f~(t+dt)f(t+dt)+f(t+dt)f(t)=δf+df+δ(df)\begin{aligned} \tilde{f}\left(t+\mathrm dt\right)-f\left(t\right)&=\tilde{f}\left(t+\mathrm dt\right)-\tilde f\left(t\right)+\tilde f\left(t\right)-f\left(t\right)=\delta f+\mathrm df+\mathrm d\left(\delta f\right)\\ &=\tilde{f}\left(t+\mathrm dt\right)-f\left(t+\mathrm dt\right)+f\left(t+\mathrm dt\right)-f\left(t\right)=\delta f+\mathrm df+\delta\left(\mathrm df\right) \end{aligned}

因此可以推出

δ(ddtf(t))=ddt(δf(t))(1.8)\boxed{\delta\left(\frac{\mathrm d}{\mathrm dt}f\left(t\right)\right)=\frac{\mathrm d}{\mathrm dt}\left(\delta f\left(t\right)\right)}\tag{1.8}

1.3 泛函导数

1.3.1 泛函导数的概念

​ 对于一阶导数

df(t)=df(t)dtdt\mathrm d f\left(t\right)=\frac{\mathrm d f\left(t\right)}{\mathrm dt}\mathrm dt

​ 类比普通函数的导数.对于泛函 S[f]S[f] ,其变分是由函数的变分引起的:

S[f~]=S[f+ϵδf]=S[f]+ϵδS[f]+ϵ22δ2S[f]+ϵ33!δ3S[f]+(1.9)\begin{equation} \begin{aligned} S[\tilde f]=&S[f+\epsilon\delta f]\\ =&S[f]+\epsilon\delta S[f]+\frac{\epsilon^2}{2}\delta^2S[f]+\frac{\epsilon^3}{3!}\delta^3S[f]+\cdots \end{aligned} \end{equation}\tag{1.9}

定义

δS[f]=dtδSδf(t)δf(t)(1.10)\boxed{\delta S[f]=\int\mathrm dt\frac{\delta S}{\delta f\left(t\right)}\delta f\left(t\right)}\tag{1.10}

其中 δS\delta S 是泛函的一阶变分, δSδf(t)\frac{\delta S}{\delta f\left(t\right)}一阶泛函导数.

​ 类比函数的高阶导数,高阶泛函导数定义为

δ2S[f]:=dt1dt2δ2Sδf(t1)δf(t2)δf(t1)δf(t2)(1.11)\delta^2S[f]:=\int\mathrm dt_1\int \mathrm dt_2\frac{\delta ^2 S}{\delta f\left(t_1\right)\delta f\left(t_2\right)}\delta f\left(t_1\right)\delta f\left(t_2\right) \tag{1.11}

1.3.2 泛函导数的操作定义

​ 将 S[f+ϵδf]S[f+\epsilon\delta f] 视为 ϵ\epsilon 的普通函数,将式(1.9)视作关于 ϵ\epsilon 的普通泰勒展开:

S[f+ϵδf]=S[f]+ϵddϵS[f+ϵδf]ϵ=0+ϵ22d2dϵ2S[f+ϵδf]ϵ=0+(1.12)S[f+\epsilon\delta f]=S[f]+\left.\epsilon\frac{\mathrm d}{\mathrm d \epsilon}S[f+\epsilon\delta f]\right |_{\epsilon=0}+\left.\frac{\epsilon^2}{2}\frac{\mathrm d^2}{\mathrm d \epsilon^2}S[f+\epsilon\delta f]\right |_{\epsilon=0}+\cdots \tag{1.12}

即有

δS=ddϵS[f+ϵδf]ϵ=0=dtδSδf(t)δf(t)(1.13)\boxed{\delta S=\left.\frac{\mathrm d}{\mathrm d \epsilon}S[f+\epsilon\delta f]\right |_{\epsilon=0}=\int\mathrm dt\frac{\delta S}{\delta f\left(t\right)}\delta f\left(t\right)}\tag{1.13}

​ 对于式(1.3)形式的泛函

S[f+δf]=t1t2dtL(t,f+δf,f+δf,)S[f+\delta f]=\int_{t_1}^{t_2}\mathrm dtL\left(t,f+\delta f,f'+\delta f’,\cdots\right)

可以得到

δS=t1t2dtddϵL(t,f+ϵδf,f+ϵδf,)ϵ=0=t1t2dt(Lfδf+Lfδf+)δL(1.14)\begin{equation} \begin{aligned} \delta S&=\int_{t_1}^{t_2}\mathrm dt\left .\frac{\mathrm d}{\mathrm d\epsilon}L\left(t,f+\epsilon\delta f,f'+\epsilon\delta f',\cdots\right)\right |_{\epsilon=0}\\ &=\int_{t_1}^{t_2}\mathrm dt\underbrace{\left(\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial f'}\delta f'+\cdots\right)}_{\equiv\delta L} \end{aligned} \end{equation}\tag{1.14}

其中被积函数为 LL 的变分 δL\delta L ,其与微分 dL\mathrm d L 形式全同.这意味着

δS=δ(t1t2dtL)=t1t2dtδL(1.15)\delta S=\delta\left(\int_{t_1}^{t_2}\mathrm dtL\right)=\int_{t_1}^{t_2}\mathrm dt\delta L\tag{1.15}

​ 我们用分部积分的方法进行处理

Lfδf=变分和求导交换顺序ddt(Lfδf)全导数ddt(Lf)δf(1.16)\frac{\partial L}{\partial f'}\delta f'\xlongequal{变分和求导交换顺序} \underbrace{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\delta f\right)}_{全导数}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f\tag{1.16}

类似的

Lfδf=ddt(Lfδf)ddt(Lf)δf=ddt(Lfδfddt(Lf)δf)全导数+d2dt2(Lf)δf(1.17)\begin{equation} \begin{aligned} \frac{\partial L}{\partial f''}\delta f’' &= \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\delta f'\right)-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\right)\delta f'\\ &=\underbrace{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\delta f'-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\right)\delta f\right)}_{全导数}+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f \end{aligned} \end{equation}\tag{1.17}

因此

δS=t1t2dt[Lfδfddt(Lf)δf+d2dt2(Lf)δf+dBdt]=t1t2dt[Lfddt(Lf)+d2dt2(Lf)]f+Bt1t2(1.18)\begin{equation} \begin{aligned} \delta S=&\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial f}\delta f-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f-\cdots+\frac{\mathrm d\mathcal B}{\mathrm dt}\right]\\ =&\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)-\cdots\right]\partial f+\left.\mathcal B \right |_{t_1}^{t_2} \end{aligned} \end{equation}\tag{1.18}

​ 这里 dBdt\frac{\mathrm d\mathcal B}{\mathrm dt} 代表全导数项,积分到最后得到的 Bt1t2\left. \mathcal B \right |_{t_1}^{t_2} 被称作边界项.

​ 两个被积函数“相差全导数”,或者两个积分“相差边界项”,这件事在变分法种非常重要,用 \simeq 来表示

L1L2    L1=L2+dF(t,f,f,)dt(1.19)\boxed{L_1\simeq L_2 \iff L_1=L_2+\frac{\mathrm dF\left(t,f',f'',\cdots\right)}{\mathrm d t}} \tag{1.19}

以及

L1L2    S1=S2+Ft1t2L_1\simeq L_2\iff S_1=S_2+\left . F\right |_{t_1}^{t_2}

式(1.16)和(1.17)可以写成

Ffδfddt(Lf)δfFfδf=d2dt2(Lf)δf(1.20)\frac{\partial F}{\partial f'}\delta f'\simeq-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f',\frac{\partial F}{\partial f''}\delta f''=\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f \tag{1.20}

1.3.3 计算一阶泛函导数的标准手续
  1. 将变分符号 δ\delta 移到积分号内:

    δS=dtL(t,f,f,)(1.21)\delta S=\int \mathrm dtL\left(t,f',f'',\cdots\right)\tag{1.21}

  2. 按照类似复合函数求导的规则,计算 δL\delta L

    δS=dt(Lfδf+Lfδf+Lfδf+)(1.22)\delta S=\int \mathrm dt\left(\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial f'}\delta f'+\frac{\partial L}{\partial f''}\delta f''+\cdots\right) \tag{1.22}

  3. 做分部积分

  4. 提取 δf\delta f 前系数,即一阶泛函导数

    δSdt[Lfddt(Lf)+d2dt2(Lf)+]δf(1.23)\delta S\simeq\int \mathrm dt\left[\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)+\cdots\right ]\delta f \tag{1.23}

    δSδf=Lfddt(Lf)+d2dt2(Lf)+(1.24)\boxed{\frac{\delta S}{\delta f}=\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)+\cdots} \tag{1.24}

Example 1.1

​ 考虑泛函 S[f]=dt[(f(t))2(f(t))2]S[f]=\int\mathrm dt\left[\left(f'\left(t\right)\right)^2-\left(f\left(t\right)\right)^2\right] ,有

δS=dtδ(f2f2)=d(2fδf2fδf)=dt(2f2f)δf\begin{aligned} \delta S=&\int \mathrm dt\delta\left(f'^2-f^2\right)=\int\mathrm d\left(2f'\delta f'-2f\delta f\right)\\ =&\int \mathrm dt\left(-2f''-2f\right)\delta f \end{aligned}

因此一阶泛函导数为

δSδf=2f2f\frac{\delta S}{\delta f}=-2f''-2f

Example 1.2

​ 考虑泛函 S[f]=dt[f(t)f(t)+f(t)f(t)]S[f]=\int \mathrm dt\left[f\left(t\right)f'\left(t\right)+f'\left(t\right)f''\left(t\right)\right],有

δS[f]=dt(δff+fδf+δff+fδf)=dt(ff+ff)δf=0\begin{aligned} \delta S[f]=&\int \mathrm dt\left(\delta ff'+f\delta f'+\delta f'f''+f'\delta f''\right)\\ =&\int\mathrm dt\left(f'-f'+f''-f''\right)\delta f=0 \end{aligned}

实际上

ff+ff=ddt(12(f2+f2))ff'+f'f''=\frac{\mathrm d}{\mathrm dt}\left(\frac 12\left(f^2+f'^2\right)\right)

1.4 泛函极值

1.4.1 泛函极值的必要条件

​ 显然泛函 S[f]S[f]f=f(t)f=\overline f\left(t\right) 时取极小(大)值时,只有不发生偏移,即 δf=0\delta f=0 时取极值 .另一方面,由式(1.12),S[f+ϵδf]S[\overline f+\epsilon \delta f] 可看作参数 ϵ\epsilon 的普通函数,在 ϵ=0\epsilon=0 处取极值.结合泛函导数的定义,有

δS[f]=dtδS[f]δfδff=dS[f+ϵδf]dϵϵ=0=0(1.25)\delta S[\overline f]=\int \mathrm dt\left .\frac{\delta S[f]}{\delta f}\delta f\right|_{\overline f}=\left .\frac{\mathrm dS[\overline f+\epsilon \delta f]}{\mathrm d\epsilon}\right |_{\epsilon =0}=0\tag{1.25}

由此得到泛函在 f=f(t)f=\overline f\left(t\right) 时取极值,即要求泛函的一阶变分为零:

δS[f]=0(1.26)\boxed{\delta S[\overline f]=0}\tag{1.26}

1.4.2 欧拉-拉格朗日方程

​ 一类常见的泛函具有如下形式

S[f]=dtL(t,f(t),f(t))(1.27)S[f]=\int \mathrm dt L\left(t,f\left(t\right),f'\left(t\right)\right)\tag{1.27}

根据式(1.26),泛函取极值的必要条件是

δSδfddt(Lf)Lf=0(1.28)-\frac{\delta S}{\delta f}\equiv\boxed{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)-\frac{\partial L}{\partial f}=0}\tag{1.28}

式(1.28)是关于 f(t)f\left(t\right) 的二阶微分方程,被称为变分问题的欧拉-拉格朗日方程(Euler-Lagrange equation).

​ 对 LL 直接求全导数

dLdt=Lt+Lff+Lff=Lt+Lff+ddt(Lff)ddt(Lf)f=Lt(Lfddt(Lf))=0f+ddt(Lff)\begin{aligned} \frac{\mathrm dL}{\mathrm dt}=&\frac{\partial L}{\partial t}+\frac{\partial L}{\partial f}f'+\frac{\partial L}{\partial f'}f''=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial f}f'+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'\right)-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)f'\\ =&\frac{\partial L}{\partial t}-\underbrace{\left(\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\right)}_{=0}f'+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'\right) \end{aligned}

因此当欧拉-拉格朗日方程(1.28)满足时,下式也成立

ddt(LffL)+Lt=0(1.29)\boxed{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'-L\right)+\frac{\partial L}{\partial t}=0} \tag{1.29}

一个立即的结论是,若 LL 不显含积分变量 tt

Lt=0LffL=const(1.30)\frac{\partial L}{\partial t}=0\tag{1.30}\Rightarrow \frac{\partial L}{\partial f'}f'-L=const

​ 对于更一般的泛函式(1.3),其取极值的必要条件是

δSδf=n=0(1)ndndtn(Lf(n))=0(1.31)\frac{\delta S}{\delta f}=\sum_{n=0}\left(-1\right)^n\frac{\mathrm d^n}{\mathrm dt^n}\left(\frac{\partial L}{\partial f^{\left(n\right)}}\right)=0\tag{1.31}

Example 1.3

​ 平面上两固定点直接由任意光滑曲线连接,曲线方程基座 y=f(x)y=f\left(x\right) ,曲线长度为 S=dx1+(f(x))2S=\int \mathrm dx\sqrt{1+\left(f'\left(x\right)\right)^2} ,变分得到

δS=dxf1+f2δf=dxf(1+f2)3/2δf\delta S=\int \mathrm dx\frac{f'}{\sqrt{1+f'^2}}\delta f'=-\int \mathrm dx\frac{f''}{\left(1+f'^2\right)^{3/2}}\delta f

于是曲线长度取极值的必要条件即 f(x)f\left(x\right) 满足 f(1+f2)3/2=0\frac{f''}{\left(1+f'^2\right)^{3/2}}=0 ,其等价于 f=0f''=0 ,通解为 y=ax+by=ax+b .

Example 1.4(最速下降曲线)

​ 当小球下降到 yy 处时,12mv2=mgy\frac 12m\boldsymbol{v}^2=mgy ,因此速度大小 vv=2gyv\equiv|\boldsymbol v|=\sqrt{2gy} ,下落到 AA 点的用时

T[y]=dx1+y22gyT[y]=\int \mathrm dx \frac{\sqrt{1+y'^2}}{\sqrt{2gy}}

观察到被积函数 L=1+y22gyL=\frac{\sqrt{1+y'^2}}{\sqrt{2gy}}xx 无关,即式(1.30)的情况

LffL=12gy1+y2=const\frac{\partial L}{\partial f'}f'-L=-\frac{1}{\sqrt{2gy}\sqrt{1+y'^2}}=const

y(x)y\left(x\right) 满足

y(1+y2)=const(1.32)y\left(1+y'^2\right)=const\tag{1.32}

可以验证式(1.32)有参数方程解,y(θ)=a(1cosθ)y\left(\theta\right)=a\left(1-\cos\theta\right)x(θ)=a(θsinθ)x\left(\theta\right)=a\left(\theta -\sin \theta\right) ,其所描述的曲线即为摆线(cycloid)

1.4.3 多个变量和多元函数

​ 考虑泛函

S=S[f1,f2,]=dtL(t,f1,f2,,f1,f2,)(1.33)S=S[f_1,f_2,\cdots]=\int \mathrm dtL\left(t,f_1,f_2,\cdots,f_1',f_2',\cdots\right)\tag{1.33}

其极值同样要求

δS=dt(δSδf1δf1+δSδf2δf2+)=0(1.34)\delta S=\int \mathrm dt\left(\frac{\delta S}{\delta f_1}\delta f_1+\frac{\delta S}{\delta f_2}\delta f_2+\cdots\right)=0\tag{1.34}

因为函数 f1,f2,f_1,f_2,\cdots 相互独立,其变分 δf1,δf2,\delta f_1,\delta f_2,\cdots 也是相互独立的,因此上述式子要求每一项的系数都为零,于是泛函取极值的要求

δSδf1=0, δSδf2=0, (1.35)\frac{\delta S}{\delta f_1}=0,\ \frac{\delta S}{\delta f_2}=0,\ \cdots\tag {1.35}

Example 1.5

​ 考虑依赖于两个函数 f(t)f\left(t\right)n(t)n\left(t\right) 的泛函

S[f.n]=dt12[1n(t)(f(t))2n(t)(f(t))2]S[f.n]=\int \mathrm dt\frac 12\left[\frac{1}{n\left(t\right)}\left(f'\left(t\right)\right)^2-n\left(t\right)\left(f\left(t\right)\right)^2 \right]

首先对 f(t)f\left(t\right) 做变分,得到

δS=dt12(1n2fδfn2fδf)dt[ddt(fn)nf]δf\delta S=\int \mathrm dt\frac12\left(\frac{1}{n}2f'\delta f'-n2f\delta f \right)\simeq\int \mathrm dt\left[-\frac{\mathrm d}{\mathrm dt}\left(\frac{f'}{n}\right)-nf \right]\delta f

因此 δS=0\delta S=0,要求

δSδf=ddt(fn)+nf=0(1.36)-\frac{\delta S}{\delta f}=\frac{\mathrm d}{\mathrm dt}\left(\frac{f'}{n}\right)+nf=0\tag{1.36}

再对 n(t)n\left(t\right) 做变分,得到

δS=dt12(1n2f2f2)δn\delta S=\int \mathrm dt\frac{1}{2}\left(-\frac{1}{n^2}f'^2-f^2\right)\delta n

因此 δS=0\delta S=0,要求

δSδn=12n2f2+12f2(1.37)-\frac{\delta S}{\delta n}=\frac{1}{2n^2}f'^2+\frac12f^2\tag{1.37}

泛函 S[f,n]S[f,n] 取极值的必要条件即 f(t)f\left(t\right)n(t)n\left(t\right) 满足式(1.36)和(1.37)

​ 泛函中的函数也可以是多元函数,以单个函数 ff 的泛函 S[f]S[f] 为例,设 ffttxx 的二元函数 f=f(t,x)f=f\left(t,x\right) .简单起见,我们只考虑 LL 含有 ff 的一阶导数,泛函具有形式

S=dtdxL(t,x,f,ft,fx)(1.38)S=\iint \mathrm dt\mathrm dxL\left(t,x,f,\frac{\partial f}{\partial t},\frac{\partial f}{\partial x}\right)\tag{1.38}

同样按照之前的步骤,泛函的一阶变分为

δS=dtdxδL(t,x,f,ft,fx)=dtdx[Lfδf+L(ft)δ(ft)+L(fx)δ(fx)]=dtdx[Lft(L(ft))x(L(fx))]δf\begin{aligned} \delta S=&\iint \mathrm dt\mathrm dx\delta L\left(t,x,f,\frac{\partial f}{\partial t},\frac{\partial f}{\partial x}\right)\\ =&\iint \mathrm dt\mathrm dx\left[\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\delta\left(\frac{\partial f}{\partial t}\right)+\frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\delta\left(\frac{\partial f}{\partial x}\right) \right]\\ =&\iint \mathrm dt\mathrm dx\left[\frac{\partial L}{\partial f}- \frac{\partial}{\partial t}\left(\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\right) -\frac{\partial}{\partial x}\left( \frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\right) \right]\delta f\\ \end{aligned}

所以泛函取极值的必要条件即

δSδf=Lft(L(ft))x(L(fx))=0(1.39)\frac{\delta S}{\delta f}=\frac{\partial L}{\partial f} -\frac{\partial}{\partial t}\left(\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\right) -\frac{\partial}{\partial x}\left( \frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\right)=0\tag{1.39}

习题

1.5 考虑一条补课拉伸,质量均匀的柔软喜神,长为 ll ,质量为 mm ,细绳两端点悬挂于相同高度,水平距离为 a(a<l)a(a<l) .

(1) 选择合适的坐标,求细绳总的重力势能 VV 作为细绳形状的泛函.

(2)求细绳重力势能取极值时,细绳形状所满足的欧拉-拉格朗日方程.

proofproof

(1) 以细绳的一个端点作为原点,建立坐标系,细绳总的重力势能 VV 可以写成

V=0adx1+y2lmgy=0adxmgly1+y2V=\int_0^a \mathrm dx \frac{\sqrt{1+y'^2}}{l} mgy=\int_0^a \mathrm dx\frac{mg}{l}y\sqrt{1+y'^2}

(2)做变分

δV=0adxmgl(δy1+y2+yy1+y2δy)0adxmgly2yy+1(1+y2)3/2δy\begin{aligned} \delta V=&\int_{0}^a \mathrm dx \frac{mg}{l}\left(\delta y\sqrt{1+y'^2}+\frac{yy'}{\sqrt{1+y'^2}}\delta y' \right)\\ \simeq&\int_{0}^a \mathrm dx \frac{mg}l\frac{y'^2-yy''+1}{\left( 1+y'^2 \right )^{3/2}}\delta y \end{aligned}

因此 δV=0\delta V=0,要求

δVδy=mgly2yy+1(1+y2)3/2=0-\frac{\delta V}{\delta y}=-\frac{mg}l\frac{y'^2-yy''+1}{\left( 1+y'^2 \right )^{3/2}}=0

即细绳形状满足微分方程

y2yy+1=0y^2-yy''+1=0

Chapter 2 位形空间

2.1 位形与时间演化

2.1.1 位形

位形(configuration)即粒子系统中各个粒子的空间位置,或者更一般的物理系统在空间中的形状、分布.位形的概念可以推广至连续系统和非机械系统.

2.1.2 位形空间与流形

​ 系统所有可能位形的集合,就构成位形空间(configuration space).位形空间中的一点,即代表系统的一种可能的位形.

​ 一般来说,物理系统的位形空间一般不是平坦的线性空间(矢量空间).例如,球面是一个二维空间,但显然不是平坦的.但是,球面局部的一小块,看上去又和二维平面很想,数学上对这种一般的空间的描述,即所谓流形(manifold)理论.

2.1.3 世界线

​ 随着时间的演化,位形空间中的点在这个空间中也扫出一条连续的曲线,有时被称作时间线(world line).

2.2 广义坐标

2.2.1 广义坐标的概念

​ 对位形空间的参数化即广义坐标(generalized coordinates),其是任意一组都能够唯一确定系统某个位形的独立参数.

位置位形普通空间  位形空间普通坐标  广义坐标\begin{aligned} 位置\quad &\to \quad 位形\\ 普通空间 \ &\to\ 位形空间\\ 普通坐标 \ &\to\ 广义坐标 \end{aligned}

Example 2.1 圆环上粒子的位形

​ 如图所示,粒子在固定圆环上无摩擦的自由滑动,粒子在圆环上的角度唯一决定粒子的位置,所以系统具有一个独立的广义坐标即 θ\theta .这个系统的位形空间就是圆周,通常记作 S1\mathbf{S}^1 .

Example 2.2 单摆的位形

(a)一个独立广义坐标 θ\theta ,位形空间为一维圆周 S1\mathbf{S}^1 .

(b)两个独立广义坐标 xxθ\theta ,位形空间为二维柱面 R1×S1\mathrm{R}^1\times \mathrm{S}^1 .

(c)球坐标 {θ,ϕ}\{\theta,\phi\} ,位形空间为二维球面 S2\mathrm{S}^2 .

Example 2.3 刚性杆连接两个粒子的位形

​ 系统具有 3 个独立的广义坐标 {x1,y1,θ}\{x_1,y_1,\theta\} ,位形空间为 R2×S1\mathbf{R}^2\times\mathbf{S}^1 .

Example 2.4 双摆的位移

​ 两个杆的摆角唯一决定了双摆的位形.两个杆的白交 θ1\theta_1θ2\theta_2 各自都具有 2π2\pi 的周期性,所以双摆的位形空间是 S1×S1T2\mathbf{S}^1\times \mathbf{S}^1\equiv \mathbf{T}^2 ,其代表二维环面.

​ 物理系统 ss 个独立的广义坐标

{q1,,qs}qa,a=1,2,,s(2.1)\boxed{\{q^1,\cdots,q^s\}\equiv q^a,\quad a=1,2,\cdots,s}\tag{2.1}

代表位形空间的一点,即代表系统某个唯一确定的位形,因此,

位形空间的位数=独立广义坐标的个数(2.2)位形空间的位数=独立广义坐标的个数 \tag{2.2}

2.2.2 广义坐标的变换

​ 现在假设两个广义坐标 {q}\{q\}{q~}\{\tilde q\} ,描述同一个位形空间,考虑此位形空间中的任意点 PP(给定的位形),对应 {q}\{q\} 坐标的数值记作 qP\left. q\right |_P{q~}\{\tilde{q}\} 坐标的数值记作 q~P\left .\tilde{q}\right |_P ,两组坐标的数值满足函数关系

q~aP=fa(t,qaP),a=1,2,,s(2.3)\left. \tilde {q}^a\right|_P=f^a(t,\left . q^a\right |_P),\quad a=1,2,\cdots,s \tag{2.3}

习惯上用 q~a\tilde{q}^a 本身作为变换的函数名,即

qaq~a=q~a(t,qa),a=1,2,,s(2.4)\boxed{q^a\to \tilde q^a=\tilde q^a(t,q^a)},\quad a=1,2,\cdots,s\tag{2.4}

这种广义坐标之间的变换也叫做点变换(point transformation).我们要求式(2.4)是可逆的,即存在

q~aqa=qa(t,q~a)(2.5)\tilde q^a\to q^a=q^a(t,\tilde q^a)\tag{2.5}

也就是说 {q}\{q\}{q~a}\{\tilde q^a\} 是一一对应的.可逆性要求坐标变换的雅可比行列式非零,即

det(q~aqa)0(2.6)\det(\frac{\partial \tilde q^a}{\partial q^a})\neq 0\tag{2.6}

注意 q~bqa\frac {\partial \tilde q^b}{\partial q^a}qaq~b\frac{\partial q^a}{\partial \tilde q^b} 满足

b=1sqaq~bq~bqc=δac(2.7)\sum_{b=1}^s\frac{\partial q^a}{\partial \tilde q^b}\frac{\partial \tilde q^b}{\partial q^c}=\delta_{ac}\tag{2.7}

2.3 速度、速度相空间

2.3.1 速度相空间

​ 对于一般的物理系统,从广义坐标 {q}\{q\} 出发,广义速度(generalized velocity)定义为广义坐标的时间导数

va=dqa(t)dtq˙a,a=1,2,,s(2.8)\boxed{v^a=\frac{\mathrm d q^a(t)}{\mathrm dt}\equiv \dot{q}^a},\quad a=1,2,\cdots,s\tag{2.8}

​ 物理系统所有可能状态的集合,即状态空间,也被称为相空间(phase space).“坐标”和"速度“构成的状态空间,被称为速度相空间(velocity space),速度相空间中的一点 {q,q˙}\{q,\dot{q}\} 代表系统的一种可能的状态,因此

相空间的位数=唯一确定系统演化的独立参数的个数(2.9)相空间的位数=唯一确定系统演化的独立参数的个数\tag{2.9}

对于点粒子系统,相空间的位数总是偶数维的,这是因为点粒子系统的运动方程总是需要偶数个初始条件.

2.3.2 广义坐标的变换所诱导的广义速度变换

​ 在式(2.4)的坐标变换下,广义速度的变换为

q~˙adq~adt=b=1sq~aqbq˙b+q~t~(2.10)\dot{\tilde q}^a\equiv\frac{\mathrm d \tilde q^a}{\mathrm dt}=\sum_{b=1}^s \frac{\partial \tilde q^a}{\partial q^b}\dot q^b+\frac{\partial \tilde q}{\partial \tilde t}\tag{2.10}

其中 q~aqb\frac{\partial \tilde q^a}{\partial q^b} 即坐标变换的雅可比矩阵,逆变换即

qadqadt=b=1sqaq~bq~˙b+qt~(2.11){ q}^a\equiv\frac{\mathrm d q^a}{\mathrm dt}=\sum_{b=1}^s \frac{\partial q^a}{\partial \tilde q^b}\dot {\tilde q}^b+\frac{\partial q}{\partial \tilde t}\tag{2.11}

其中 qaq~b\frac{\partial q^a}{\partial\tilde q^b}q~aqb\frac{\partial \tilde q^a}{\partial q^b} 的逆.雅可比行列式 qaq~b\frac{\partial q^a}{\partial \tilde q^b}q~aqb\frac{\partial\tilde q^a}{\partial q^b} 都只是广义坐标的函数,因此还可以得到

q~a˙q˙b=q~aqb,qa˙q~b˙=qaq~b(2.12)\frac{\partial \dot {\tilde q^a}}{\partial \dot q^b}=\frac{\partial \tilde q^a}{\partial q^b},\quad\frac{\partial \dot {q^a}}{\partial \dot{\tilde q^b}}=\frac{\partial q^a}{\partial \tilde q^b}\tag{2.12}

即广义速度之间的偏导关系等于广义坐标之间的偏导关系.数学上,这正是广义坐标作为逆变矢量在广义坐标变换下的变化关系.

2.4 约束

2.4.1 约束的概念

​ 对系统所能达到的状态(即广义坐标和广义速度)所强加的运动学限制条件即约束(constraint).这里”运动学“表明约束和相互作用,即和动力学(加速度)没有关系.

​ 约束是对系统状态的限制,也就是对”坐标“和”速度“的限制.当不存在约束时,系统的广义坐标记为 ${q^1,\cdots,q^m} $,则约束的一般数学表达式为

ϕ(t,q1,,qm,q˙1,,q˙m)=0(2.13)\phi(t,q^1,\cdots,q^m,\dot{q}^1,\cdots,\dot{q}^m)=0\tag{2.13}

2.4.2 约束的分类

​ 定常约束(seleronomous constraint)和非定常约束(rheonomous constraint).约束方程不显含时间,即

ϕ(q1,,qm,q˙1,,q˙m)=0(2.14)\phi(q^1,\cdots,q^m,\dot q^1,\cdots,\dot q^m)=0\tag{2.14}

为定常约束.需要强调的是,定常约束在另一个有相对运动的参考系中看,则表现为一个非定常约束.但反过来,不是所有的非定常约束都可以通过改变参考系变换为定常约束.


​ 约束最重要的一种分类是所谓的完整约束和非完整约束.约束方程具有形式

ϕ(t,q1,,qm)=0(2.15)\phi(t,q^1,\cdots,q^m)=0\tag{2.15}

则被称为完整约束(holonomic constraint),也叫几何约束,完整约束是对广义坐标之间的约束关系,是对系统”可能位形“的直接限制.完整约束表面有些广义坐标其实是不独立的,可以直接用其他(真正独立的)广义坐标表示出来.如果一个系统的所有约束皆为完整约束,则该系统称为完整系统(holonomic system).记无约束时系统的广义坐标为 {q1,,qm}\{q^1,\cdots,q^m\} ,若存在且只存在 kk 个独立的完整约束

ϕα(t,q1,,qm)=0,α=1,,k(2.16)\phi_\alpha(t,q_1,\cdots,q^m)=0,\quad \alpha=1,\cdots,k\tag{2.16}

则系统独立的广义坐标数为

s=mk(2.17)s=m-k\tag{2.17}

​ 所有不是完整约束的约束——亦即约束方程无法写成式(2.15)形式的约束即是非完整约束(nonholonomic constraint).非完整约束中最重要的一类式不可积微分约束(non-integrable differential constraints).所谓微分约束,即约束方程形如

ϕ(t,q1,,qm,q˙1,,q˙m)=0(2.18)\phi(t,q^1,\cdots,q^m,\dot q^1,\cdots,\dot q^m)=0 \tag{2.18}

如果一个系统含有未完整约束,即称为非完整系统(non-holonomic system).

Example 2.10 非完整约束:独轮车

​ 独轮车(unicycle)是最简单的非完整约束的例子。如图所示,半径为 RR 的轮子,在水平面上做纯滚动(即轮子不打滑)。简单起见,假定轮面和水平面垂直,可用 {x,y,θ,ϕ}\{x,y,\theta,\phi\}这 4 个参数描述此系统的位形。满足 2 个约束方程

ϕ1x˙Rϕ˙cosθ=0,ϕ2y˙Rϕ˙sinθ=0(2.19)\phi_1\equiv\dot x-R\dot \phi \cos\theta=0,\quad\phi_2\equiv\dot y-R\dot \phi \sin\theta=0\tag{2.19}

这是关于 {x,y,θ,ϕ}\{x,y,\theta,\phi\} 这 4 个广义坐标的 2 个微分约束。现在证明,式(2.19)中的两个微分约束是不可积的。首先,式(2.19)可以写成

dxRcosθdϕ=0,dyRsinθdϕ=0(2.20)\mathrm dx-R\cos \theta\mathrm d\phi=0,\quad \mathrm dy-R\sin\theta \mathrm d\phi=0\tag{2.20}

数学上可以证明,微分式 F1dx1+F2dx2+F3dx3F_1\mathrm dx^1+F_2\mathrm dx^2+F_3\mathrm dx^3 乘以某个积分因子 λ\lambda 后是全微分,亦即存在 Φ\Phi 使得 dΦ=λ(F1dx1+F2dx2+F3dx3)\mathrm d\Phi=\lambda(F_1\mathrm dx^1+F_2\mathrm dx^2+F_3\mathrm dx^3) 的充分必要条件是

F1(F2x3F3x2)+F2(F3x1F1x3)+F3(F1x2F2x1)=0(2.21)F_1\left(\frac{\partial F_2}{\partial x^3}-\frac{\partial F_3}{\partial x^2}\right)+ F_2\left(\frac{\partial F_3}{\partial x^1}-\frac{\partial F_1}{\partial x^3}\right)+ F_3\left(\frac{\partial F_1}{\partial x^2}-\frac{\partial F_2}{\partial x^1}\right) =0\tag{2.21}

式(2.20)中的两个微分式都不满足,即左边不是全微分。

Example 2.11 非完整约束:两轮车

​ 两轮车的简化模型如图所示,轮子半径为 RR ,两轮心距离为 ll ,轮子在水平面上做纯滚动,后轮方向固定,通过前轮转向。简单起见,假设轮面和水平面垂直。为了描述此系统的位形,首先可以确定后轮的位置 {x,y}\{x,y\} ,以及后轮的偏向角 ϕ\phi 和后轮的自转角 αB\alpha _B。这是,前轮的位置也自然确定了,由几何关系得到

xA=xlsinϕ,yA=y+lcosϕ(2.22)x_A=x-l\sin\phi,\quad y_A=y+l\cos\phi\tag{2.22}

能够调节的还有前轮的转向角 θ\theta 和自转角 αA\alpha _A 。所以,系统的位形需要用 66 个参数 {x,y,θ,ϕ,αA,αB}\{x,y,\theta,\phi,\alpha_A,\alpha_B\} 描述。注意当前轮的转向角 θ\theta 固定时,前后轮的运动轨迹是同心圆,圆心 OO 则是前后轮面垂线的交点。和独轮车一样,列出前后轮的约束。对于后轮

x˙=Rα˙Bsinϕ,y˙=Rα˙Bcosϕ(2.23)\dot x=-R\dot \alpha_B\sin\phi,\quad \dot y=R\dot \alpha _B\cos\phi\tag{2.23}

对于前轮

x˙lϕ˙cosϕ=Rα˙Asin(ϕ+θ),y˙lϕ˙sinϕ=Rα˙Acos(ϕ+θ)(2.24)\dot x-l\dot \phi\cos\phi=-R\dot \alpha _A\sin(\phi+\theta),\quad \dot y-l\dot \phi\sin\phi=R\dot\alpha_A\cos(\phi+\theta)\tag{2.24}

由上式重新组合,也可以得到等价的、几何意义更加明显的约束方程

Rα˙Acosθ=Rα˙B,Rα˙A=lcotθϕ˙(2.25)R\dot \alpha_A\cos\theta=R\dot \alpha_B,\quad R\dot\alpha_A=l\cot \theta\dot \phi\tag{2.25}

总之,对于两轮车,6 个广义坐标满足 4 个非完整约束。

2.5 自由度

​ 完整约束直接消除了广义坐标之间的独立性,表明广义坐标之间由约束关系。这种关系即体现在广义坐标之间,也体现在广义坐标的“变分”之间。由约束方程 ϕ(t,q)=0\phi(t,\mathbf q)=0 变分得到

δϕ=a=1mϕqaδqa=0(2.26)\delta \phi=\sum_{a=1}^m\frac{\partial \phi}{\partial q^a}\delta q^a=0\tag{2.26}

其表面广义坐标不是独立的,满足上面的线性关系。式(2.26)具有非常直观的几何意义,如图所示,一个完整约束可视为位形空间中的一张曲面,系统的位形限制在这张曲面上,因此广义坐标也必然限制在约束面上。式(2.32)中的 ϕqa\frac{\partial \phi}{\partial q^a} 即约束面在位形空间中的梯度,即约束面的法向 ϕ\nabla\phi,式(2.32)正表明广义坐标变分 δq\delta q 与约束面的法向 ϕ\nabla \phi 正交,即切于约束面。

​ 对于完整系统,一个重要的特征量即独立广义坐标的数目,且每一个完整约束降低一个独立广义坐标变分的数目。而对于非完整约束,约束本身并不能降低独立广义坐标的数目,而只能降低独立广义坐标“变分”的数目。可见,相较于独立广义坐标数目本身,独立广义坐标“变分”的数目更能反映出系统的性质,这就直接导致了自由度(degrees of freedom)的概念。简言之,自由度等于独立广义坐标变分的数目。需要强调的是,自由度是系统的内禀性质,与具体广义坐标的选取无关。

​ 一个完整约束同时减少一个独立坐标和独立速度分量,一个非完整约束之间少一个独立速度分量。对于非完整约束,广义坐标的个数通常大于真正的自由度。亦即,我们需要额外的变量来参数化其位形,这正体现了非完整系统路径依赖的特性。总之,

完整系统:自由度=广义坐标个数非完整系统:自由度<广义坐标个数\begin{aligned} 完整系统:自由度&=广义坐标个数\\ 非完整系统:自由度 &\lt 广义坐标个数 \end{aligned}

物理系统的时间演化由微分方程描述,从微分方程定解的角度,问题可以归结为我们需要知道多少个独立的初始条件,才能确定一组定解。或者说,我们由多少个独立参数,可以用以调节从而得到系统的不同演化。这一问题也被称作柯西初值问题(Cauchy initial value problem)。对于自然界常见的系统,约定每 1 个自由度的演化由其广义坐标和广义速度(即状态)的初值,即 2 个参数决定。在这个意义上,自由度可以等价地定义为

自由度=12唯一确定系统状态的独立参数个数=12唯一确定系统演化的初始条件的个数=12相空间的位数(2.34)\begin{aligned} 自由度 &=\frac 12\cdot唯一确定系统状态的独立参数个数\\ &=\frac 12\cdot唯一确定系统演化的初始条件的个数\\ &=\frac 12 \cdot 相空间的位数 \end{aligned} \tag{2.34}

对于点粒子系统,相空间的维数总是偶数,于是保证了自由度都是整数。

Chapter 3 相对论时空观

​ 力学研究物理系统的时间演化。物理系统的韵达规律总是在某个时空背景上加以描述,所以力学的首要问题即是时空观(view on space and time),即对于时间和空间的基本观念。

3.1 时空的基本概念

3.1.1 时空

​ 时间的一瞬和空间的一点的联合就给定了一个“时空点”,记作 pp 。对于任何一个时空点 pp ,我们都可以用 44 个实数(cc 为光速)

{ct,x,y,z}{x0,x1,x2,x3}{xμ},μ=0,1,2,3(3.1)\{ct,x,y,z\}\equiv \{x^0,x^1,x^2,x^3\} \equiv\{x^{\mu}\},\quad\mu=0,1,2,3 \tag{3.1}

来对其参数化。全体时空点的集合即时空(spacetime)。

3.2 度规

3.2.1 度规

​ 记空间坐标为 {qa}\{q^a\},则无穷小距离的平方可以表示成坐标微分 {dqa}\{\mathrm d q^a\} 的二次型。这个无穷小距离的平方被称作线元(line element),通常记作 ds2\mathrm d s^2 ,写成矩阵的形式即

ds2=(dq1dqs)(g11g1sgs1gss)(dq1dqs)(3.2)\mathrm d s^2= \begin{pmatrix} \mathrm dq^1 & \cdots & \mathrm dq^s \end{pmatrix} \begin{pmatrix} g_{11}& \cdots & g_{1s} \\ \vdots & \ddots & \vdots \\ g_{s1} & \cdots & g_{ss} \end{pmatrix} \begin{pmatrix} \mathrm dq^1\\ \vdots \\ \mathrm d q^s \end{pmatrix} \tag {3.2}

这里由二次型的系数构成的对称矩阵 gabg_{ab} 被称作度规(metric)。

3.2.2 一些典型空间的度规

​ 2 维欧氏空间的线元可以写成

ds2=i=12j=12δijdxidxj,δi,j=(1001),i,j=1,2(3.3)\mathrm ds^2=\sum_{i=1}^2\sum_{j=1}^2 \delta_{ij}\mathrm dx^i \mathrm dx^j,\quad {\delta_{i,j}= \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} } ,\quad i,j=1,2 \tag{3.3}

​ 极坐标 {r,ϕ}\{r,\phi\}

ds2=i=12j=12gijdxidxj,gi,j=(100r2),i,j=r,ϕ(3.4)\mathrm d s^2=\sum_{i=1}^2\sum_{j=1}^2 g_{ij}\mathrm dx^i \mathrm d x^j,\quad{ g_{i,j}= \begin{pmatrix} 1 & 0\\ 0 & r^2 \end{pmatrix}}, \quad i,j=r,\phi \tag{3.4}

​ 3 维欧氏空间

ds2=i=13j=13δijdxidxj,δi,j=(100010001),i,j=1,2,3(3.5)\mathrm ds^2=\sum_{i=1}^3\sum_{j=1}^3 \delta_{ij}\mathrm dx^i \mathrm dx^j,\quad {\delta_{i,j}= \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{pmatrix} } ,\quad i,j=1,2,3 \tag{3.5}

​ 球坐标 {r,ϕ,θ}\{r,\phi,\theta\}

ds2=i=13j=13gijdxidxj,gi,j=(1000r2000r2sin2θ),i,j=r,ϕ,θ(3.6)\mathrm d s^2=\sum_{i=1}^3\sum_{j=1}^3 g_{ij}\mathrm dx^i \mathrm d x^j,\quad{ g_{i,j}= \begin{pmatrix} 1 & 0 & 0\\ 0 & r^2 & 0\\ 0 & 0 & r^2\sin^2 \theta \end{pmatrix}}, \quad i,j=r,\phi,\theta \tag{3.6}

3.2.3 度规的一般定义

​ 当选取某个做坐标 {qa}\{q^a\} 时,空间中的线元总是可以表达成坐标微分 {dqa}\{\mathrm d q^a\} 的二次型:

ds2=a=1Db=1Dgabdqadqb(3.7)\mathrm d s^2=\sum_{a=1}^D\sum_{b=1}^D g_{ab}\mathrm dq^a\mathrm dq^b\tag{3.7}

这里 DD 表示空间的维数;gabg_{ab} 即度规,是非退化的即 detgab0\det g_{ab} \neq 0 ,且是对称的 gab=gbag_{ab}=g_{ba} 。采用爱因斯坦求和约定(Einstein summation convention),线元通常写成

ds2=gabdqadqb(3.8)\boxed{\mathrm d s^2=g_{ab}\mathrm dq^a\mathrm d q^b} \tag{3.8}

规定逆度规(inverse metric)

gab:=(g1)ab(3.9)\boxed{g^{ab}:=(g^{-1})_{ab}}\tag{3.9}

3.2.4 时空的度规

​ 爱因斯坦狭义相对论的时空背景是所谓闵可夫斯基时空(Minkowski spacetime),简称闵氏时空,取直角坐标

{xμ}={x0,x1,x2,x3}={ct,x,y,z}(3.10)\{x^\mu\}=\{x^0,x^1,x^2,x^3\}=\{ct,x,y,z\} \tag{3.10}

闵氏时空的线元为

ds2=c2(dt)2+(dx)2+(dy)2+(dz)2ημνdxμdxν(3.11)\mathrm d s^2=-c^2(\mathrm dt)^2+(\mathrm dx)^2+(\mathrm dy)^2+(\mathrm dz)^2\equiv\eta_{\mu\nu}\mathrm dx^\mu\mathrm dx^\nu\tag{3.11}

因此闵氏时空的度规和逆度规分别为

ημν=(1000010000100001),ημν=(1000010000100001)(3.12)\eta_{\mu\nu}= \begin{pmatrix} -1 & 0 & 0 &0\\ 0 & 1 & 0 &0\\ 0 & 0 & 1 & 0\\ 0 & 0 &0 & 1 \end{pmatrix},\quad \eta^{\mu\nu}= \begin{pmatrix} -1 & 0 & 0 &0\\ 0 & 1 & 0 &0\\ 0 & 0 & 1 & 0\\ 0 & 0 &0 & 1 \end{pmatrix}\tag{3.12}

​ 对于一个一般的时空北京,度规可以写成

ds2=gμνdxμdxν(3.24)\mathrm ds^2=g_{\mu\nu}\mathrm d x^\mu\mathrm dx^\nu \tag{3.24}

3.2.5 逆变和协变

​ 在矢量或张量上方的指标被称为上标(upper index)或逆变指标(contravariant index),在下方的指标被称为下标(lower index)或协变指标(covariant index)。相应地,带上标的矢量(例如广义速度 qa˙\dot{q^a})被称为逆变矢量(contravariant vector),带下标的矢量(例如梯度 af\nabla _a f)被称为协变矢量(covariant vector)。

Chapter 4 最小作用量原理

4.2 作用量

作用量(action)

S[q]=t1t2dtL(t,q,q˙)(4.1)S[q]=\int_{t_1}^{t_2}\mathrm dtL(t,q,\dot{q}) \tag{4.1}

最小作用量原理(principle of least action)

δS=0(4.2)\delta S =0\tag{4.2}

4.2.2 广义动量

​ 物理系统某个广义坐标 qaq^a 对于的广义动量(generalized momentum)定义为

pa:=Lqa˙Lva,a=1,,s(4.3)\boxed{p_a:=\frac{\partial L}{\partial \dot{q^a}}\equiv\frac{\partial L}{\partial v^a}},\quad a=1,\cdots,s\tag{4.3}

广义坐标 qaq^a 及其对应的广义动量 pap_a 构成一对共轭变量 {qa,pa}\{q^a,p_a\} ,因此式(4.3)定义的广义动量又被称为共轭动量(conjugate momentum)或正则动量(canonical momentum)。

4.3 自由粒子

4.3.1 4 维形式

​ 自由粒子的作用量最简单的取法即时间线的长度

S=mcds=mcημνdxμdxν(4.4)S=-mc\int|\mathrm ds|=-mc\int \sqrt{-\eta_{\mu\nu}\mathrm dx^\mu\mathrm dx^\nu}\tag{4.4}

​ 原则上可以用任一单调变化的参数来参数化世界线。最简单和自然的参数化即取固有时 τ\tau

ds2=ημνdxμdxνc2dτ2(4.5)\mathrm ds^2=\eta_{\mu\nu}\mathrm dx^{\mu}\mathrm dx^{\nu}\equiv -c^2\mathrm d \tau^2\tag{4.5}

因此自由粒子的作用量式(4.4)还可以写成

S=mcdτημνdxμdτdxνdτ(4.6)S=-mc\int \mathrm d\tau\sqrt{-\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}} \tag{4.6}

粒子的时空坐标 xμx^\mu 随固有时 τ\tau 的变化率被称为 4-速度(4-velocity)

uμ:=dxμ(τ)dτ(4.7)u^\mu:=\frac{\mathrm dx^\mu(\tau)}{\mathrm d\tau} \tag{4.7}

其实 4 维时空中的矢量。由式(4.5)

uμuμημνdxμdτdxνdτ=c2(4.8)u_\mu u^\mu\equiv\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm dx^\nu}{\mathrm d\tau}=-c^2 \tag{4.8}

即粒子的 4-速度 uμu^\mu 的模方是常数 c2-c^2

​ 将式(4.6)对 xμx^\mu 求变分,并利用式(4.8),得到

δS=mcdτδημνdxμdτdxνdτ=mdτημνδ(dxμdτ)dxνdτmdτημνd2xνdτ2δxμ(4.8)\begin{aligned} \delta S&=-mc\int \mathrm d\tau\delta \sqrt{-\eta_{\mu\nu}\frac{\mathrm d x^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}}=m\int\mathrm d\tau \eta_{\mu\nu}\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau}\right)\frac{\mathrm d x^\nu}{\mathrm d\tau}\\ &\simeq -m\int\mathrm d\tau \eta_{\mu\nu} \frac{\mathrm d^2 x^\nu}{\mathrm d\tau^2}\delta x^\mu \end{aligned} \tag{4.8}

所以粒子的自由运动方程为

d2xνdτ2=0(4.9)\frac{\mathrm d^2 x^\nu}{\mathrm d \tau^2}=0 \tag{4.9}

​ 引入 4-速度后,自由粒子的作用量式(4.6)可以写成 S=dτLS=\int \mathrm d\tau L ,这里 L=mcημνuμuνL=-mc\sqrt{-\eta_{\mu\nu}u^\mu u^\nu} ,粒子的 4-动量为

pμ:=Luμ=uμ(mcηρσuρuσ)=muμ(4.10)p_\mu:=\frac{\partial L}{\partial u^\mu}=\frac{\partial}{\partial u^\mu}(-mc\sqrt{-\eta_{\rho\sigma}u^\rho u^\sigma})=mu_\mu\tag{4.10}

4.3.2 3 维形式

​ 式(4.4)可以写成

S=mcc2(dt)2δijdxidxj=mc2dt11c2δijdxidtdxjdt(4.11)S=-mc\int\sqrt{c^2(\mathrm dt)^2-\delta_{ij}\mathrm dx^i\mathrm dx^j}=-mc^2\int \mathrm dt\sqrt{1-\frac{1}{c^2}\delta_{ij}\frac{\mathrm dx^i}{\mathrm d t}\frac{\mathrm dx^j}{\mathrm dt}} \tag{4.11}

其中出现了粒子空间坐标 {xi}\{x^i\} 随着时间参数 tt 的变化率

vi:=dxidt,i=1,2,3(4.12)v^i:=\frac{\mathrm dx^i}{\mathrm dt},\quad i=1,2,3 \tag{4.12}

即通常所说的”速度“,也被称作 3-速度(3-velocity),为 3 维空间中的矢量。于是作用量式(4.4)称为

S=dtL,L=mc21v2c2(4.13)S=\int \mathrm dtL,\quad L=-mc^2\sqrt{1-\frac{v^2}{c^2}} \tag{4.13}

其中 v2δijvivjv^2\equiv \delta_{ij}v^iv^j,式(4.13)就是闵氏时空中自由粒子作用量的 3 维形式。这里自然地出现了著名的洛伦兹因子 (Lorentz factor)

dtdτ=11v2c2γ(4.14)\frac{\mathrm dt}{\mathrm d\tau}=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}}\equiv\gamma \tag{4.14}

​ 同时可以得到 3-动量

piLvi=vi(mc21v2c2)=mvi1v2c2,i=1,2,3(4.15)p_i\equiv\frac{\partial L}{\partial v^i}=\frac{\partial}{\partial v^i}\left(-mc^2\sqrt{1-\frac{v^2}{c^2}}\right)=\frac{mv_i}{\sqrt{1-\frac{v^2}{c^2}}}\tag{4.15},\quad i=1,2,3

这里 vi=δijvjv_i=\delta_{ij} v^j。利用式(4.14)及 3-速度的定义, 3-动力还可以写成

pi=mdxidtdtdτ=mdxidτmui,i=1,2,3(4.16)p_i=m\frac{\mathrm dx_i}{\mathrm dt}\frac{\mathrm dt}{\mathrm d\tau}=m\frac{\mathrm dx_i}{\mathrm d\tau}\equiv mu_i,\quad i=1,2,3 \tag{4.16}

可见 3-动量对应空间坐标对于固有时 τ\tau 的变化率(4-速度的空间分量)。牛顿力学中的动量 mvimv_i 只是严格的 3-动量在非相对论极限下的近似。

​ 对于时间分量,定义

E:=cp0=mcu0=mc2dtdτ=mc21v2c2(4.17)E:=cp^0=mcu^0=mc^2\frac{\mathrm dt}{\mathrm d\tau}=-\frac{mc^2}{\sqrt{1-\frac{v^2}{c^2}}}\tag{4.17}

为粒子的能量。于是 4-动量的模方可以分解为

pμpμ=(p0)2+δijpipjE2c2+p2(4.18)p_\mu p^\mu=-(p^0)^2+\delta_{ij}p^ip^j\equiv -\frac{E^2}{c^2}+p^2\tag{4.18}

这里 p2=δijpipjp^2=\delta_{ij}p^ip^j。而由式(4.8)得,4-动量的模方是常数

pμpμ=m2uμuμ=m2c2(4.19)p_\mu p^\mu=m^2u_\mu u^\mu=-m^2c^2\tag{4.19}

即给出

E2=p2c2+m2c4(4.20)E^2=p^2c^2+m^2c^4\tag{4.20}

这就是著名的爱因斯坦能量-动量关系(energy-momentum relation)。

4.4 外场中的粒子

4.4.1 标量场

​ 考虑闵氏时空标量场中的粒子。标量场对粒子的影响可以有各种方式,我们考虑最简单的情形,即使得线元长度发生变化 $|\mathrm ds|\rightarrow e^\Phi|\mathrm ds| $,因此作用量为

S=mceΦds=mcdτeΦuμuμ(4.21)S=-mc\int e^\Phi|\mathrm ds|=-mc\int \mathrm d\tau e^\Phi\sqrt{-u_\mu u^\mu} \tag{4.21}

其中 Φ=Φ(t,x)Φ(x)\Phi=\Phi(t,x)\equiv \Phi(x) 是无量纲的标量场,uμu^\mu 为 4-速度式。对作用量式(4.21)对时空坐标 xμx^\mu 求变分得到运动方程

d2xμdτ2+Φxνxντdxμdτ+c2Φxμ=0,μ=0,1,2,3(4.22)\frac{\mathrm d^2x_\mu}{\mathrm d\tau^2}+\frac{\partial \Phi}{\partial x^\nu}\frac{\partial x^\nu}{\partial \tau}\frac{\mathrm dx_\mu}{\mathrm d\tau}+c^2\frac{\partial \Phi}{\partial x^\mu}=0,\quad \mu=0,1,2,3\tag{4.22}

推导

δS=mcdτδ(eΦημνdxμdτdxνdτ)=mdτ[c2eΦΦxμδxμ+eΦδ(dxμdτ)dxνdτ]mdτ[ddτ(eΦdxνdτ)+c2eΦΦxμ]δxμ=mdτeΦ(d2xμdτ2+Φxνxντdxμdτ+c2dΦxμ)δxμ\begin{aligned} \delta S&=-mc\int\mathrm d\tau \delta\left(e^\Phi\sqrt{-\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}}\right)\\ &=m\int\mathrm d\tau\left[-c^2e^\Phi\frac{\partial \Phi}{\partial x^\mu}\delta x^\mu +e^\Phi\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau}\right)\frac{\mathrm d x^\nu}{\mathrm d\tau}\right]\\ &\simeq -m\int \mathrm d\tau\left[\frac{\mathrm d}{\mathrm d\tau}\left(e^\Phi\frac{\mathrm d x^\nu}{\mathrm d\tau} \right)+ c^2e^\Phi\frac{\partial \Phi}{\partial x^\mu}\right]\delta x^\mu\\ &=-m\int\mathrm d\tau e^\Phi\left(\frac{\mathrm d^2 x^\mu}{\mathrm d \tau^2}+\frac{\partial \Phi}{\partial x^\nu}\frac{\partial x^\nu}{\partial \tau}\frac{\mathrm dx^\mu}{\mathrm d\tau}+c^2\frac{\mathrm d\Phi}{\partial x^\mu } \right)\delta x^\mu \end{aligned}

类似地,作用量式(4.38)的 3 维形式为

S=mc2dteΦ1v2c2(4.23)S=-mc^2\int \mathrm dte^\Phi\sqrt{1-\frac{v^2}{c^2}}\tag{4.23}

将其对空间坐标 xix^i 变分即得到运动方程的 3 维形式

pi˙+Φ˙pi+mc21v2c2Φxi=0,i=1,2,3(4.24)\dot{p_i}+\dot{\Phi}p_i+mc^2\sqrt{1-\frac{v^2}{c^2}}\frac{\partial \Phi}{\partial x^i}=0,\quad i=1,2,3\tag{4.24}

​ 在有外场存在的情况下,我们同时考虑“低速”和“弱场”的极限,即

vc1,ΦVmc21(4.25)\frac{|v|}{c}\ll1,\quad|\Phi|\equiv\frac{|V|}{mc^2}\ll1\tag{4.25}

其中 VV 具有能量量纲。因为 Vmc2|V|\ll mc^2 的意义是与外场相互作用的能量远远小于粒子的静止能量 mc2mc^2 。因此上面的极限也可以统称为非相对论极限。在非相对论极限下,运动方程式(4.24)展开并保留至速度 vvVV 的领头阶 为

mxi¨=Vxi(4.26)m\ddot{x_i}=-\frac{\partial V}{\partial x^i} \tag{4.26}

其中右边 Vxi-\frac{\partial V}{\partial x^i}VV 的空间梯度,正是牛顿力学中保守力的形式。这表明在非相对论极限下, $V $ 具有牛顿力学中势能的意义。另一方面,作用量的 3 维形式(4.23)也可展开并保留领头阶,得到

S=mc2dteVmc21v2c2=mc2dt(1+Vmc2+)(112v2c2+)=dtmc2+dt(12mv2V)+(4.27)\begin{aligned} S&=-mc^2\int \mathrm dt e^{\frac{V}{mc^2}}\sqrt{1-\frac{v^2}{c^2}}=-mc^2\int\mathrm dt(1+\frac{V}{mc^2}+\cdots)(1-\frac{1}{2}\frac{v^2}{c^2}+\cdots)\\ &=-\int \mathrm dt mc^2+\int \mathrm dt\left (\frac12mv^2-V\right)+ \cdots \end{aligned} \tag{4.27}

除去常数项,在非相对论极限下,拉格朗日量在与速度和外场有关的领头阶具有“动能减去势能”的形式:

L=12mv2VTV(4.28)L=\frac{1}{2}mv^2-V\equiv T-V \tag{4.28}

其中 T=12mv2T=\frac 12 mv^2 即牛顿力学的动能,VV 在非相对论极限下对于牛顿力学的势能。从展开的过程可以看出,这里“减号”的来源正是闵氏时空度规中时间和空间部分的符号差异。

4.4.2 电磁场

​ 接下来考虑粒子与 4 维矢量场 AμA^\mu 的相互作用,最熟悉的矢量场即电磁场。考虑闵氏时空,作用量必须是洛伦兹标量。因此,问题转化为如何用矢量场和粒子的世界线来构造一个标量,最简单的方式就是矢量场与粒子 4-速度的内积 AμuμA_\mu u^\mu ,将这个标量沿着粒子的世界线积分,自然仍然是一个标量。于是,矢量场对粒子的作用量贡献为

dτAμuμ=dτAμdxμdτ=Aμdxμ(4.29)\int \mathrm d\tau A_\mu u^\mu=\int \mathrm d\tau A_\mu \frac{\mathrm dx^\mu}{\mathrm d\tau}=\int A_\mu \mathrm dx^\mu \tag{4.29}

矢量场中粒子的完整作用量即

S=dτL,L=mcuμuμ+ecAμuμ(4.30)\boxed{S=\int \mathrm d\tau L,\quad L=-mc\sqrt{-u_\mu u^\mu}+\frac{e}{c}A_\mu u^\mu } \tag{4.30}

这里常数 ee 代表了粒子与矢量场 AμA_\mu 的耦合强度。对于电磁场,ee 即粒子的电荷。

​ 电磁场对粒子运动方程的贡献来源于对第二项的变分。有

δdτAμuμ=dτ(Aμxνδxνuμ+Aμδ(dxμdτ))dτ(AμxνuμδxνAμxνuνδxμ)dτFμνuνδxμ\begin{aligned} \delta\int \mathrm d\tau A_\mu u^\mu &=\int \mathrm d\tau\left(\frac{\partial A_\mu}{\partial x^\nu}\delta x^\nu u^\mu+A_\mu\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau} \right) \right)\\ &\simeq \int \mathrm d\tau\left(\frac{\partial A_\mu}{\partial x^\nu}u^\mu\delta x^\nu-\frac{\partial A_\mu}{\partial x^\nu}u^\nu\delta x^\mu \right)\equiv\int \mathrm d\tau F_{\mu\nu}u^\nu \delta x^\mu \end{aligned}

其中

Fμν:=AνxμAμxν(4.31)\boxed{F_{\mu\nu}:=\frac{\partial A_\nu}{\partial x_\mu}-\frac{\partial A_\mu}{\partial x_\nu}} \tag{4.31}

被称为电磁张量(electromagnetic tensor)或电磁场强。由定义可知 FμνF_{\mu\nu} 是一个反对称的张量,即 Fμν=FνμF_{\mu\nu}=-F_{\nu\mu}。结合自由粒子作用量的变分式,最终得到电磁场中粒子的运动方程为

dpμdτ=ecFμνuν(4.32)\frac{\mathrm d p_\mu}{\mathrm d\tau}=\frac{e}{c}F_{\mu\nu}u^\nu \tag{4.32}

​ 4-矢量 AμA^\mu 可以分解为

Aμ=(A0,Ai)(Φ,A)(4.33)A^\mu=(A^0,A^i)\equiv(\Phi,A) \tag{4.33}

其中 Φ\Phi 被称为标量势(scalar potential),AA 被称为矢量势(vector potential)。这里的所谓“标量”和“矢量“都是指 3 维空间中的标量和矢量。式(4.29)分解为

Aμdxμ=(A0dx0+δijAidxj)=(cΦdt+Aidxi)=dt(cΦ+Aivi)\begin{aligned} \int A_\mu \mathrm dx^\mu&=\int (-A^0\mathrm dx^0+\delta_{ij}A^i\mathrm dx^j)=\int (-c\Phi\mathrm dt+A_i\mathrm dx^i)\\ &=\int \mathrm dt(-c\Phi+A_iv^i) \end{aligned}、

可以得到电磁场中相对论性带电粒子作用量的 3 维形式即

S=dtL,L=mc21v2c2eΦ+ecvA(4.34)\boxed{S=\int \mathrm dtL,\quad L=-mc^2\sqrt{1-\frac{v^2}{c^2}}-e\Phi+\frac{e}{c}v\cdot A} \tag{4.34}

将式(4.34)对 xix^i 变分可得到运动方程的 3 维形式

dpdt=eE+ecv×B(4.35)\frac{\mathrm dp}{\mathrm dt}=eE+\frac{e}{c}v\times B \tag{4.35}

其中 pp 为 3-动量式。

E=Φ1cAt,B=×A(4.36)E=-\nabla \Phi-\frac 1c \frac{\partial A}{\partial t},\quad B=\nabla\times A\tag{4.36}

分别为电场强度 EE 和磁感应强度 BB 。式(4.35)的右边正是带电粒子在电磁场中所受的洛伦兹力。

推导

δS=dtδ(mc21v2c2eΦ+ecvA)=dt[mvi1v2c2δvieΦxiδxi+ec(Aiδvi+viδAi)]dt(dpidteΦxiecAt+ec(vjAjxiAixjvj))δxi\begin{aligned} \delta S &=\int \mathrm dt\delta\left(-mc^2\sqrt{1-\frac{v^2}{c^2}}-e\Phi+\frac{e}{c}v\cdot A \right)\\ &=\int \mathrm dt\left[\frac{mv_i}{\sqrt{1-\frac{v^2}{c^2}}}\delta v^i-e\frac{\partial \Phi}{\partial x^i}\delta x^i+\frac{e}{c}\left(A_i\delta v^i+v^i\delta A_i \right) \right]\\ &\simeq \int \mathrm dt\left(-\frac{\mathrm d p_i}{\mathrm dt}-e\frac{\partial \Phi}{\partial x^i} -\frac{e}{c}\frac{\partial A}{\partial t}+\frac{e}{c}\left(v^j\frac{\partial A_j}{\partial x^i} -\frac{\partial A_i}{\partial x^j}v^j\right) \right)\delta x^i \end{aligned}

其中

vjAjxiAixjvj=v(A)(v)A=v×(×A)v^j\frac{\partial A_j}{\partial x^i}-\frac{\partial A_i}{\partial x^j}v^j=v\cdot(\nabla A)-(v\cdot \nabla)A=v\times(\nabla \times A)

整理得到

dpdt=e(Φ1cAt)+cev×(×A)\frac{\mathrm dp}{\mathrm dt}=e\left(-\nabla \Phi-\frac{1}{c}\frac{\partial A}{\partial t} \right)+\frac{c}{e}v\times(\nabla\times A)

下证 v(A)(v)A=v×(×A)v\cdot (\nabla A)-(v\cdot \nabla)A=v\times(\nabla \times A)

[v(A)(v)A]i=vj(iAjjAi)[v\cdot(\nabla A)-(v\cdot\nabla)A]_i=v_j(\partial _i A_j-\partial _jA_i )

[v×(×A)]i=ϵijkvj(ϵkmnmAn)=(δimδjnδinδjm)vjmAn=vj(iAjjAi)\begin{aligned} {[v\times(\nabla\times A)]}_i &=\epsilon_{ijk}v_j(\epsilon_{kmn}\partial_m A_n)\\ &=(\delta_{im}\delta_{jn}-\delta_{in}\delta_{jm})v_j\partial_mA_n\\ &=v_j(\partial _i A_j-\partial_jA_i) \end{aligned}

4.5 非相对论极限下作用量的基本形式

​ 在非相对论极限下,作用量具有形式

S=dtL=dt(TV)(4.37)S=\int \mathrm dt L=\int \mathrm dt(T-V) \tag{4.37}

其中 TT 被称为动能(kinetic energy),VV 被称作势能(potential energy)。

​ 对于 NN 个粒子组成的粒子系统,记第 α\alpha 个粒子的直角坐标为 x(α)x_{(\alpha)},则系统的总动能为

T=α=1N12m(α)x˙(α)2(4.38)T=\sum_{\alpha=1}^N \frac 12 m_{(\alpha)}\dot{x}^2_{(\alpha)} \tag{4.38}

若换为广义坐标 {qa},a=1,,3N\{q^a\},a=1,\cdots,3N,则有

x(α)=x(α)(t,q),α=1,,N(4.39)x_{(\alpha)}=x_{(\alpha)}(t,q),\quad \alpha=1,\cdots,N \tag{4.39}

速度的变换关系为

x˙(α)x(α)qaq˙a+x(α)t(4.40)\dot{x}_{(\alpha)}\equiv\frac{\partial x_{(\alpha)}}{\partial q^a}\dot{q}^a+\frac{\partial x_{(\alpha)}}{\partial t}\tag{4.40}

于是动能用广义坐标 {q}\{q\} 及广义速度 {q˙}\{\dot{q}\} 表示为

T=α=1N12m(α)(x(α)qaq˙a+x(α)t)(x(α)qbq˙b+x(α)t)(4.41)T=\sum_{\alpha=1}^N \frac 12 m_{(\alpha)}\left(\frac{\partial x_{(\alpha)}}{\partial q^a}\dot{q}^a+\frac{\partial x_{(\alpha)}}{\partial t} \right)\cdot\left(\frac{\partial x_{(\alpha)}}{\partial q^b}\dot{q}^b+\frac{\partial x_{(\alpha)}}{\partial t} \right) \tag{4.41}

整理得到

T=12Gabq˙aq˙b+Xaq˙a+Y(4.42)T=\frac{1}{2}G_{ab}\dot{q}^a\dot{q}^b+X_a\dot{q}^a+Y\tag{4.42}

即动能为广义速度的二次多项式,其中

Gab(t,q)=α=1Nm(α)x(α)xax(α)xb(4.43)G_{ab}(t,q)=\sum_{\alpha=1}^N m_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial x^a}\cdot\frac{\partial x_{(\alpha)}}{\partial x^b}\tag{4.43}

Xa(t,q)=α=1Nm(α)x(α)qax(α)t(4.44)X_a(t,q)=\sum_{\alpha=1}^Nm_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial q^a}\cdot \frac{\partial x_{(\alpha)}}{\partial t} \tag{4.44}

Y(t,q)=α=1Nm(α)x(α)tx(α)t(4.45)Y(t,q)=\sum_{\alpha=1}^N m_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial t}\cdot\frac{\partial x_{(\alpha)}}{\partial t} \tag{4.45}

都只是与广义坐标和 tt 的函数,与广义速度无关。

​ 若约束非定常,则从直角坐标到广义坐标的变换 x(α)(t,q)x_{(\alpha)}(t,q) 显含时间,因此 XaX_aYY 一般不为零。对于定常系统, x(α)(q)x_{(\alpha)}(q) 不显含时间,因此

x(α)t=0  Xa=0, Y=0(4.46)\frac{\partial x_{(\alpha)}}{\partial t}=0\ \Rightarrow\ X_a=0,\ Y=0 \tag{4.46}

这意味着对于定常系统,动能总是广义速度的二次型

T=12Gab(q)q˙aq˙b(4.47)T=\frac{1}{2} G_{ab}(q) \dot{q}^a\dot{q}^b \tag{4.47}

这里 Gab(q)G_{ab}(q) 一般依赖于广义坐标,是一个对称、正定的矩阵,势能 VV 则只是广义坐标的函数

V=V(q)(4.48)V=V(q) \tag{4.48}

总之,非相对论性定常系统的拉格朗日量的一般形式即

L=TV=12Gab(q)q˙aq˙bV(q)(4.49)L=T-V=\frac 12 G_{ab}(q)\dot{q}^a\dot{q}^b -V(q)\tag{4.49}

Chapter 5 对称性和守恒律

5.1 运动常数

​ 考虑自由度为 ss 的完整系统,由广义坐标 qq 描述,拉格朗日量为 L=L(t,q,q˙)L=L(t,\boldsymbol q, \dot{\boldsymbol q}) 系统运动方程的解为 {qcl(t)}\{q_{cl}(t)\} ,即对应真实的运动。广义坐标 {qcl(t)}\{q_{cl}(t)\} 及广义速度 {q˙cl(t)}\{\dot{q}_{cl}(t) \} 一般是随时间变化的,但是存在 {t,q,q˙}\{t,\boldsymbol q,\dot{\boldsymbol q} \} 组成的函数 C=C(t,q,q˙)C=C(t,\boldsymbol q,\dot {\boldsymbol q}) ,其值只取决于初始条件,在真实的运动过程中保持不变,即有

dC(t,q(t),q(t))˙dtqcl=0(5.1)\left . \frac{\mathrm d C(t,\boldsymbol q(t),\dot {\boldsymbol q(t))}}{\mathrm dt}\right |_{q_{cl}}=0 \tag{5.1}

这样的函数被称为运动常数(constant of motion)。

Example 5.1 一维谐振子的运动常数

​ 考虑一维谐振子,拉格朗日量为 L=TV=12mq˙212mω2q2L=T-V=\frac 12 m\dot q^2-\frac 12 m\omega^2q^2,运动方程为 q¨+ω2q=0\ddot q+\omega ^2q=0。对应初始条件 q(0)=q0q(0)=q_0q˙(0)=v0\dot q(0)=v_0 的解为

qcl=q0cos(ωt)+v01ωsin(ωt)q_{cl}=q_0\cos(\omega t)+v_0\frac 1\omega\sin(\omega t)

对定解式求导,得到

q˙cl=q0ωsin(ωt)+v0cos(ωt)\dot q_{cl}=-q_0\omega\sin(\omega t)+v_0\cos(\omega t)

从中可以将 q0q_0v0v_0 解出

q0=qclcos(ωt)q˙clωsin(ωt),v0=qclωsin(ωt)+q˙clcos(ωt)q_0=q_{cl}\cos(\omega t)-\frac{\dot q_{cl}}{\omega}\sin(\omega t),\quad v_0=q_{cl}\omega\sin(\omega t)+\dot q_{cl}\cos(\omega t)

这里的 q0=q0(t,q,q˙)q_0=q_0(t,q,\dot q)v0=v0(t,q,q˙)v_0=v_0(t,q,\dot q) 即运动常数,即当 q=qclq=q_{cl} 时为常数。可以验证,两者的组合

12m(ω2q02+v02)=12mq˙2+12mω2q2E(q,q˙)\frac 12 m(\omega^2q_0^2+v_0^2)=\frac 12 m\dot q^2+\frac 12 m \omega^2 q^2\equiv E(q,\dot q)

也是运动常数,且不显含时间。

​ 如果运动常数只是 {q,q˙}\{\boldsymbol q,\dot {\boldsymbol q}\} 的函数,不显含时间 tt ,也被称为“整体”运动常数。考虑自由度为 ss 的系统,其运动方程为 ss 个二阶微分方程,需要 2s2s 个初始条件,亦即 2s2s 个常数 C1,C2,,C2sC_1,C_2,\cdots,C_{2s} 来确定一组解,记作

qcla=qcla(t,C1,,C2s),a=1,,s(5.2)q_{cl}^a=q_{cl}^a(t,C_1,\cdots,C_{2s}),\quad a=1,\cdots,s\tag{5.2}

式(5.2)对时间求导,得到

q˙cla=q˙cla(t,C1,,C2s)a=1,,s(5.3)\dot q_{cl}^a=\dot q_{cl}^a(t,C_1,\cdots,C_{2s}),a=1,\cdots,s \tag{5.3}

2s2s 个函数是独立的,可以从这 2s2s 个式子中的某一个解出时间参数 tt,再代入剩下的 2s12s-1 个式子中,即得到 2s12s-1 个不显含时间的 {q,q˙}\{\boldsymbol q,\dot {\boldsymbol q}\}C1,,C2sC_1,\cdots,C_{2s} 的关系式。从中可以再解出 2s2s 个常数 C1,,C2sC_1,\cdot,C_{2s} 中的 2s12s-1 个,作为 {q,q˙}\{\boldsymbol q,\dot{\boldsymbol q}\} 的函数,即整体运动常数。因此,自由度为 ss 的系统,具有 2s12s-1 个独立的整体运动常数。整体运动常数通常与系统的对称性有关,因此具有特别的重要性。

​ 假定系统由 AABB 两部分组成,且有各自的拉格朗日量

LA=TAVA,LB=TBVB(5.4)L_A=T_A-V_A,\quad L_B=T_B-V_B \tag{5.4}

若两部分的相互作用可以忽略,则动能和势能为两部分之和,因此

T=TA+TB,V=VA+VBL=LA+LB(5.5)T=T_A+T_B,\quad V=V_A+V_B\quad \Rightarrow\quad L=L_A+L_B \tag{5.5}

因此,对于没有相互作用的多个子系统构成的系统,拉格朗日量具有可加性(additicity)。此时系统拉格朗日量 LL 对应某子系统的运动方程,与子系统自身拉格朗日量对应的运动方程完全一致,就像其他子系统不存在一样。此时,拉格朗日量和对应的运动方程被称为是退耦(decoupled)的。常常在一组广义坐标中耦合在一起的各个子系统,选取另一组广义坐标后,就变成退耦或者近似退耦的。

​ 根据是否“可加”,可将运动常数分为“可加/不可加”两类。具有可加性的运动常数也被称为守恒量,在经典力学范围内有 7 个普适的守恒量:能量(1个),动量(3个),角动量(3个)。这些守恒量与时空对称性有着深刻的联系。

5.2 广义动量、能量守恒

5.2.1 广义动量守恒

​ 若拉格朗日量中不出现“某个”广义坐标 qaq^a ,即若

Lqa=0(5.6)\frac{\partial L}{\partial q^a}=0\tag{5.6}

则称此坐标为循环坐标(cyclic coordinate)。若 qaq^a 为循环坐标,则其对应的拉格朗日量为

0=ddt(Lq˙a)Lqa=0=ddt(Lq˙a)(5.7)0=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\underbrace{\frac{\partial L}{\partial q^a}}_{=0}=\frac{\mathrm d}{\mathrm dt}\left( \frac{\partial L}{\partial \dot q^a}\right)\tag{5.7}

上式表明 Lq˙\frac{\partial L}{\partial \dot q} 对时间的全导数为零,于是得到

paLq˙a=const(5.8)p_a\equiv\frac{\partial L}{\partial \dot q^a}=const \tag{5.8}

因此,循环坐标的共轭动量是运动常数。

5.2.2 广义能量守恒

​ 考虑 ss 自由度的系统,拉格朗日量 LL 对时间 tt 的全导数为

dLdt=Lt+Lqaq˙a+Lq˙aq¨a=Lt+Lqaq˙a+ddt(Lq˙aq˙a)ddt(Lq˙)q˙a=Lt+[ddt(Lq˙a)Lqa]=0q˙a+ddt(Lq˙aq˙a)(5.9)\begin{aligned} \frac{\mathrm dL}{\mathrm dt}&=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\partial L}{\partial \dot q^a}\ddot q^a=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a\right )-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q} \right)\dot q^a\\ &=\frac{\partial L}{\partial t}+\underbrace{\left[\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\frac{\partial L}{\partial q^a} \right]}_{=0}\dot q^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a \right) \end{aligned} \tag{5.9}

因此当运动方程满足时,有下式

ddt(Lq˙aq˙aL)+Lt=0(5.10)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a-L \right)+\frac{\partial L}{\partial t}=0 \tag{5.10}

定义能量函数(energy funtion)

h(t,q,q˙):=Lq˙q˙L(t,q,q˙)(5.11)h(t,q,\dot q):=\frac{\partial L}{\partial\dot q}\dot q-L(t,q,\dot q)\tag{5.11}

于是式(5.10)意味着

dhdt=Lt(5.12)\frac{\mathrm dh}{\mathrm dt}=-\frac{\partial L}{\partial t}\tag{5.12}

若物理系统的拉格朗日量不显含时间参数,即不存在任何特别的时间标记,则有

Lt=0h=h(t,q,q˙)=const(5.13)\frac{\partial L}{\partial t}=0\quad \Rightarrow\quad h=h(t,\boldsymbol q,\dot{\boldsymbol q})=const \tag{5.13}

即若拉格朗日量不显含时间,则能量函数是运动常数。因此能量函数守恒,这样的系统又被称作保守系统(conservative system)。

5.3 时空对称性与守恒量

5.3.1 空间的均匀性和各向同性

​ 考虑 NN 个粒子组成的粒子系统。广义坐标为普通的直角坐标 {x(α)},α=1,,N\{x_{(\alpha)} \},\alpha=1,\cdots,N ,拉格朗日量为

L=L(t,x(1),,x(N),x˙(1),,x˙(N))(5.14)L=L(t,x_{(1)},\cdots,x_{(N)},\dot x_{(1)},\cdots,\dot x_{(N)}) \tag{5.14}

考虑空间坐标的无穷小变换:

x(α)(t)x~(α)(t)=x(α)+δx(α)(t),α=1,,N(5.15)x_{(\alpha)}(t)\to\tilde{x}_{(\alpha)}(t)=x_{(\alpha)}+\delta x_{(\alpha)}(t),\quad \alpha=1,\cdots,N \tag{5.15}

注意在这里每个粒子可能有不同的 δx(α)\delta x_{(\alpha)} 。在空间坐标的变换式(5.15)下,作用量的变化为

δS=dt(Lx(α)δx(α)+Lx˙(α)δx˙(α))=dt[(ddtLx˙(α)Lx(α))=0δx(α)+ddt(Lx˙(α)δx(α))](5.16)\begin{aligned} \delta S&=\int \mathrm dt\left(\frac{\partial L}{\partial x_{(\alpha)}}\delta x_{(\alpha)}+\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta \dot x_{(\alpha)} \right)\\ &=\int \mathrm dt\left[-\underbrace{\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x_{(\alpha)}}-\frac{\partial L}{\partial x_{(\alpha)}} \right)}_{=0}\delta x_{(\alpha)}+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta x_{(\alpha)} \right) \right] \end{aligned} \tag{5.16}

因此,当运动方程满足时(即真实演化),如果要求作用量在空间坐标的连续变换下保持不变,即 δS=0\delta S=0,则必须有

ddt(Lx˙(α)δx(α))=0α=1Np(α)δx(α)=const(5.17)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta x_{(\alpha)}\right)=0\quad \Rightarrow \quad\sum_{\alpha =1}^N p_{(\alpha)}\delta x_{(\alpha)}=const \tag{5.17}

其中 p(α)Lx˙(α)p_{(\alpha)}\equiv \frac{\partial L}{\partial \dot x_{(\alpha)}} 是第 α\alpha 个粒子的动量。

​ 考虑时间坐标的任意整体**平移 **(translation)

δx(1)=δx(2)==δx(N)ξaξ^=constant vector(5.18)\delta x_{(1)}=\delta x_{(2)}=\cdots =\delta x_{(N)}\equiv \boldsymbol \xi\equiv a \boldsymbol{\hat \xi}=constant\ vector \tag{5.18}

其中 aa 是常数,代表平移的距离;ξ^\hat \xi 是与时间无关的任意常单位矢量,代表平移的方向。对于 NN 个粒子组成的粒子系统来说,这意味着所有粒子的空间坐标朝着 ξ^\hat \xi 方向整体平移了相同的距离 aa 。如果系统再空间整体平移的变化下,作用量不变则称系统具有空间均匀性(spatial homogeneity)。这是式(5.17)变成

α=1Np(α)(aξ^)=const(5.19)\sum_{\alpha =1}^N p_{(\alpha)}\cdot(a\boldsymbol{\hat \xi})=const\tag{5.19}

而因为 aa 是个常数,这意味着

pξ^=const(5.20)p_总\cdot \boldsymbol{\hat \xi}=const \tag{5.20}

这里

pα=1Np(α)α=1NLx˙(α)(5.21)p_总\equiv\sum_{\alpha=1}^Np_{(\alpha)} \equiv \sum_{\alpha =1}^N\frac{\partial L}{\partial \dot x_{(\alpha)}}\tag{5.21}

是该系统的总动量。因此,如果系统沿着某个方向具有空间均匀性,则系统的总线动量在此方向的分量守恒。

​ 在 3 维欧氏空间中的无穷小转动下,直角坐标的变换为 δx=ϕn×x\delta x=\phi \boldsymbol n\times \boldsymbol x.其中 n\boldsymbol n 是任意单位常矢量。代表转动的转轴方向;ϕ\phi 是任意无量纲常数,代表无穷小转动角度。于是所有粒子共同做整体转动即

δx(α)=ϕn×x(α),α=1,,N(5.22)\delta \boldsymbol x_{(\alpha)}=\phi \boldsymbol n\times \boldsymbol x_{(\alpha)},\quad \alpha=1,\cdots ,N \tag{5.22}

2025.10.23 理论力学课上 3 维转动矩阵 R(n^,θ)\boldsymbol R(\hat n,\theta) 推导:

考虑 r\vec r 为三维列向量,并设 v\vec{v}_{\parallel}v\vec v_{\perp} 为平行和垂直于 n^\hat n 方向上的分量,有

{v=(vn^)n^v=v(vn^)n^\begin{cases} \vec v_{\parallel}=(\vec v\cdot \hat n)\hat n\\ \vec v_{\perp}=\vec v-(\vec v\cdot \hat n)\hat n \end{cases}

建立直角坐标系 {n^,v^,n^×v^}\{\hat n,\hat v_{\perp},\hat n\times \hat v_{\perp} \} ,其中 v^=vv\hat v_{\perp}=\frac{\vec v_{\perp}}{|\vec v_{\perp}|}

考虑 3 维转动矩阵 R(n^,θ)\boldsymbol R(\hat n,\theta)

R(n^,θ)v=R(n^,θ)v+R(n^,θ)v=v+vcosθv^+vsinθn^×v^=(vn^)n^+[v(vn^)n^]cosθ+sinθn^×[v(vn^)n^]=(1cosθ)(vn^)n^+cosθv+sinθn^×v\begin{aligned} \boldsymbol R(\hat n,\theta)\vec v&=\boldsymbol R(\hat n,\theta)\vec v_{\parallel}+\boldsymbol R(\hat n,\theta)\vec v_{\perp}\\ &=\vec v_{\parallel}+ |\vec v_{\perp}|\cos\theta \hat v_{\perp}+|\vec v_{\perp} |\sin\theta \hat n\times \hat v_{\perp}\\ &=(\vec v\cdot \hat n)\hat n+[\vec v-(\vec v\cdot \hat n)\hat n]\cos\theta+\sin\theta\hat n\times[\vec v-(\vec v\cdot \hat n)\hat n]\\ &=(1-\cos\theta)(\vec v\cdot \hat n)\hat n+\cos\theta \vec v+\sin\theta\hat n\times\vec v \end{aligned}

其中

(vn^)n^=n^Tvn^=n^n^Tv(\vec v\cdot\hat n)\hat n=\hat n^T\vec v\hat n=\hat n\hat n^T\vec v

n^×v=ϵijknjvk=(ϵikjnj)vk\hat n\times \vec v=\epsilon_{ijk}n_jv_k=-(\epsilon_{ikj}n_j)v_k

引入 3 为反对称矩阵 M(n^)\boldsymbol M(\hat n)

Mij(n^)=ϵijknk=(0n3n2n30n1n2n10)\boldsymbol M_{ij}(\hat n)=-\epsilon_{ijk}n_k= \begin{pmatrix} 0&-n_3&n_2\\ n_3&0&-n_1\\ -n_2&n_1&0 \end{pmatrix}

得到

R(n^,θ)v=[(1cosθ)n^n^T+cosθI3+sinθM(n^)]v\boldsymbol R(\hat n,\theta)\vec v=[(1-\cos\theta)\hat n\hat n^T+\cos \theta \boldsymbol I_3+\sin\theta \boldsymbol M(\hat n)]\vec v

所以

R(n^,θ)=(1cosθ)n^n^T+cosθI3+sinθM(n^)=(1cosθ)ninj+cosθδijsinθϵijknk=((1cosθ)n12+cosθ(1cosθ)n1n2sinθn3(1cosθ)n1n3+sinθn2(1cosθ)n2n1+sinθn3(1cosθ)n22+cosθ(1cosθ)n2n3sinθn1(1cosθ)n3n1sinθn2(1cosθ)n3n2+sinθn1(1cosθ)n32+cosθ)\begin{aligned} \boldsymbol R(\hat n,\theta)&=(1-\cos\theta)\hat n\hat n^T+\cos\theta \boldsymbol I_3+\sin\theta \boldsymbol M(\hat n)\\ &=(1-\cos\theta)n_in_j+\cos\theta\delta_{ij}-\sin\theta \epsilon_{ijk}n_k\\ &= \begin{pmatrix} (1-\cos\theta)n_1^2+\cos\theta &(1-\cos\theta)n_1n_2-\sin\theta n_3 &(1-\cos\theta)n_1n_3+\sin \theta n_2\\ (1-\cos\theta)n_2n_1+\sin\theta n_3& (1-\cos\theta)n_2^2+\cos\theta&(1-\cos\theta)n_2n_3-\sin\theta n_1\\ (1-\cos\theta)n_3n_1-\sin\theta n_2 &(1-\cos\theta)n_3n_2+\sin\theta n_1 &(1-\cos\theta)n_3^2+\cos\theta \end{pmatrix} \end{aligned}

θ\theta 为无穷小转动时

R(n^,θ)v=[I3+θM(n^)]v+O(θ2)=v+θn^×v+O(θ2)\boldsymbol R(\hat n,\theta)\vec v=[I_3+\theta \boldsymbol M(\hat n)]\vec v+O(\theta^2)=\vec v+\theta\hat n\times\vec v+O(\theta^2)

系统在整体转动下作用量不变,则称系统具有绕此方向的空间各向同性(spatial isotropy)。此时式(5.17)称为

α=1Np(α)(ϕn×x(α))=α=1Nϕn(x(α)×p(α))=const(5.23)\sum_{\alpha=1}^N\boldsymbol p_{(\alpha)}\cdot (\phi \boldsymbol n \times \boldsymbol x_{(\alpha)})=\sum_{\alpha =1}^N \phi\boldsymbol n\cdot(\boldsymbol x_{(\alpha)}\times \boldsymbol p_{(\alpha)})=const\tag{5.23}

这里 ϕ\phi 是常数,意味着

Jn=const(5.24)\boldsymbol J_总\cdot \boldsymbol n=const \tag{5.24}

这里

J=α=1NJ(α)α=1Nx(α)×p(α)(5.25)\boldsymbol J_总=\sum_{\alpha=1}^N\boldsymbol J_{(\alpha)}\equiv \sum_{\alpha=1}^N \boldsymbol x_{(\alpha)}\times \boldsymbol p_{(\alpha)} \tag{5.25}

是粒子系统的总角动量。因此,如果系统绕某方向具有空间各向同性,则系统总角动量在此方向的分量守恒。

5.3.2 时间的均匀性

​ 若拉格朗日量不显含时间 Lt=0\frac{\partial L}{\partial t}=0,能量函数 hh 是运动常数。拉格朗日量不显含时间意味着,系统不存在特别的时间参照点,时间原点可以任意选取,即具有时间均匀性(temporal homogeneity),即时间是均匀流逝的。反映在拉格朗日量上,即时间平移(η\eta 是常数)

tt~=t+η(5.26)t\to \tilde t=t+\eta \tag{5.26}

不会引起拉格朗日量的变化。因此,能量守恒本质上反映的就是时间流逝的均匀性。

5.4 作用量的形式变换

5.4.1 拉格朗日量和全导数

​ 经典力学系统的演化由运动方程决定。初始条件(状态)给定,系统就沿着唯一的一条轨迹(相流)演化。但是拉格朗日量、作用量却有一定不确定性。如图所示,一组确定的运动方程,可以对应多个(无限多个)不如的拉格朗日量。如果两个拉格朗日量对应同一组运动方程,则两者被称为互相等价(equivalent)。

​ 物理上重要的一种等价关系,来自两个相差“时间全导数”的拉格朗日量。给定某个拉格朗日量 LL ,加上时间和广义坐标的任意函数 F(t,q)F(t,\boldsymbol q) 对时间的全导数,得到

L~(t,q,q˙)=L(t,q,q˙)+dF(t,q)dt(5.27)\tilde L(t,\boldsymbol q,\dot{\boldsymbol q}) = L(t,\boldsymbol q,\dot{\boldsymbol q})+\frac{\mathrm d F(t,\boldsymbol q)}{\mathrm dt}\tag{5.27}

对应的作用量变为

S~[q]=t1t2dtL~(t,q,q˙)=t1t2dt(L(t,q,q˙)+dF(t,q)dt)=S[q]+F(t,q)t1t2(5.28)\begin{aligned} \tilde S[\boldsymbol q]=\int_{t_1}^{t_2}\mathrm dt \tilde L(t,\boldsymbol q,\dot{\boldsymbol q})&=\int_{t_1}^{t_2}\mathrm dt\left(L(t,\boldsymbol q,\dot{\boldsymbol q})+\frac{\mathrm d F(t,\boldsymbol q)}{\mathrm dt} \right)\\ &=S[\boldsymbol q]+F(t,\boldsymbol q)|_{t_1}^{t_2} \end{aligned} \tag{5.28}

可以验证 δS~=δS\delta \tilde S=\delta S。变换式(5.27)有时也被称作拉格朗日量的规范变换(gague transformation)。

​ 习惯上用符号 “\simeq” 来表示两个拉格朗日量或者作用量等价。即有

L~=L+dFdt    L~L(5.29)\tilde L=L+\frac{\mathrm dF}{\mathrm dt}\iff \tilde L\simeq L\tag{5.29}

S~=S+Ft1t2    S~S(5.30)\tilde S=S+F|_{t_1}^{t_2}\iff \tilde S\simeq S \tag{5.30}

​ 值得一提的是,虽然相差时间全导数的两个拉格朗日量给出相同的运动方程,但是共轭动量和能量函数可能不同。由

L~=L+dF(t,q)dt=L+F(t,q)t+F(t,q)qaq˙a(5.31)\tilde L=L+\frac{\mathrm dF(t,\boldsymbol q)}{\mathrm dt}=L+\frac{\partial F(t,\boldsymbol q)}{\partial t}+\frac{\partial F(t,\boldsymbol q)}{\partial q^a}\dot q^a\tag{5.31}

于是 qaq^a 的共轭动量为

p~aL~q˙a=Lq˙a+Fqa=pa+Fqa(5.32)\tilde p_a\equiv \frac{\partial \tilde L}{\partial \dot q^a}=\frac{\partial L}{\partial \dot q^a}+\frac{\partial F}{\partial q^a}=p_a+\frac{\partial F}{\partial q^a} \tag{5.32}

可见广义坐标的共轭动量具有一定任意性,这也是相空间中广义坐标和广义动量必须被视为完全独立的变量的原因之一。对于能量函数

h~L~q˙aq˙aL~=(Lq˙a+Fq˙a)q˙a(L+Ft+Fqaq˙a)=Lq˙aq˙aL=hFt\begin{aligned} \tilde h\equiv \frac{\partial \tilde L}{\partial \dot q^a}\dot q^a-\tilde L&=\left(\frac{\partial L}{\partial \dot q^a}+\frac{\partial F}{\partial \dot q^a} \right)\dot q^a-(L+\frac{\partial F}{\partial t}+\frac{\partial F}{\partial q^a}\dot q^a)\\ &=\underbrace{\frac{\partial L}{\partial \dot q^a}\dot q^a-L}_{=h}-\frac{\partial F}{\partial t} \end{aligned}

可见

h~=hFt(5.33)\tilde h=h-\frac{\partial F}{\partial t}\tag{5.33}

这一关系在哈密顿力学中被称作哈密顿量的正则变换。

5.4.2 广义坐标的变换

​ 我们采用不同的广义坐标和时间参数描述同一条世界线,对于变换 {t,q}{t~,q~}\{t,\boldsymbol q\}\to \{\tilde t,\tilde {\boldsymbol q}\}

tt~=t~(t,q),qq~=q~(t,q)(5.34)t\to \tilde t=\tilde t(t,\boldsymbol q),\quad \boldsymbol q\to\tilde{\boldsymbol q}=\tilde{\boldsymbol q}(t,\boldsymbol q)\tag{5.34}

本节中,假定时间参数 tt 不变,重点关注广义坐标的变换。

​ 对于位形空间中给定的某点及其对应的广义速度,因为式(5.34)只是变量代换,所以拉格朗日量的数值本身是不变的,即有

L(t,q,q˙)L~(t,q~,q~˙)L(t,q,q˙)(5.35)L(t,\boldsymbol q,\dot{\boldsymbol q})\to\tilde{L}(t,\tilde {\boldsymbol q},\dot{\tilde{\boldsymbol q}})\equiv L(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.35}

同样,沿着给定轨迹,作用量的变化为

S[q]S~[q~]:=dtL~(t,q~,q~˙)=dtL(t,q,q˙)S[q](5.36)S[\boldsymbol q]\to\tilde S[\tilde{\boldsymbol q}]:=\int \mathrm dt \tilde{L}(t,\tilde {\boldsymbol q},\dot {\tilde{\boldsymbol q}})=\int \mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\equiv S[\boldsymbol q]\tag{5.36}

​ 一个问题是,运动方程在广义坐标的变化下如何变化?由

δS[q]dt(ddtLq˙aLqa)δqaδS~[q~]dt(ddtLq~a˙L~q~a)δq~a(5.37)\delta S[\boldsymbol q]\simeq-\int \mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a} \right)\delta q^a\equiv\delta \tilde S[\tilde{\boldsymbol q}]\simeq-\int\mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot{\tilde{q}^a}}-\frac{\partial \tilde L}{\partial \tilde{q}^a} \right)\delta \tilde q^a\tag{5.37}

利用广义坐标的逆变化式

δqa=qaq~bδq~b(5.38)\delta q^a=\frac{\partial q^a}{\partial \tilde q^b}\delta \tilde q^b\tag{5.38}

得到运动方程的变换关系

ddtL~q~a˙L~q~a=qbq~a(ddtLq˙bLqb),a=1,,s(5.39)\frac{\mathrm d}{\mathrm dt}\frac{\partial \tilde L}{\partial \dot{\tilde q^a}}-\frac{\partial \tilde L}{\partial \tilde q^a}=\frac{\partial q^b}{\partial \tilde q^a}\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^b}-\frac{\partial L}{\partial q^b} \right),\quad a=1,\cdots,s \tag{5.39}

如果将运动方程(即泛函导数 δSδqa\frac{\delta S}{\delta q^a}δS~δq~a\frac{\delta \tilde S}{\delta \tilde q^a})整体视为“矢量”,式(5.39)可以写成

δS~δq~aq~aqbδSδqb=0(5.40)\frac{\delta \tilde S}{\delta \tilde q^a}\equiv\frac{\partial \tilde q^a}{\partial q^b}\frac{\delta S}{\delta q^b}=0\tag{5.40}

其变换像协变矢量。

5.5 对称性

​ 在 5.3 节中已经看到,当拉格朗日量具有某些特殊形式时,会导致广义动量、能量的守恒,更物理的原因是,拉格朗日量的这些特殊形式反映了系统的对称性(symmetry)。简而言之,对称性即系统在某种变换(transformation)下的不变性(invariance)。

5.5.1 普通函数的对称性

​ 多元函数 F(x1,,xn)F(x^1,\cdots,x^n) 在自变量 xix^i 的任意无穷小变化 xix~i=xi+δxix^i\to \tilde x^i=x^i+\delta x^i 下,变化为

δF=Fxiδxi(5.41)\delta F=\frac{\partial F}{\partial x^i}\delta x^i \tag{5.41}

这里 Fxi\frac{\partial F}{\partial x^i} 是函数在自变量空间中的梯度。“对称变化”和“函数极值”相当于一个问题的一体两面。这个问题即函数在无穷小变化下的不变性,或者说——如何让函数不变。

​ (1)对于函数极值,相当于问梯度 Fxi\frac{\partial F}{\partial x^i} 满足什么条件时,是的对于任意的自变量的变化 δxi\delta x^i ,函数值不变,即

δF=Fxiδxi=对于任意 δxi0(5.42)\delta F=\frac{\partial F}{\partial x^i}\delta x^i \xlongequal{\text{对于任意 $\delta x^i$}} 0\tag{5.42}

由于 δxa\delta x^a 时任意的,于是只能要去梯度本身为零,即 Fxi=0\frac{\partial F}{\partial x^i}=0

​ (2)对于对称变换,其相当于问变换 δxi\delta x^i 满足什么条件时,使得函数总是不变的,即

δF=Fxiδsxi=对于任意 δsxi0(5.43)\delta F=\frac{\partial F}{\partial x^i}\delta_s x^i \xlongequal{对于任意\ \delta_s x^i}0 \tag{5.43}

δxi\delta x_i 不同,梯度 Fxi\frac{\partial F}{\partial x^i} 由 $F $ 的函数形式决定,所以并不是任意的。所以上式并不能导致 δsxi=0\delta_s x^i=0 ,而只是给出变换 δsxi\delta_s x^i 满足的一个关系式。

​ 可见,函数极值是对梯度 Fxi\frac{\partial F}{\partial x^i} 的限制,而对称变换则是对变换 δsxi\delta _sx^i 的限制,两者以不同的方式实现 δF=0\delta F=0 ,即函数在变分下的不变性。

5.5.2 时间与广义坐标的变换

​ 在数学上,对称变换则是在时间参数和广义坐标的变换下,作用量本身形式的变换。假设系统的广义坐标和时间参数有某种变换:

​ (1)时间的重参数化:

tt~=t~(t,q(t),q˙(t))(5.44)t\to \tilde t=\tilde t(t,\boldsymbol q(t),\dot{\boldsymbol q}(t)) \tag{5.44}

​ (2)广义坐标的变换:

qa(t)q~a(t~)=q~a(t,q(t),q˙(t)),a=1,,s(5.45)q^a(t)\to \tilde q^a(\tilde t)=\tilde q^a(t,\boldsymbol q(t),\dot{\boldsymbol q}(t)),\quad a=1,\cdots,s\tag{5.45}

​ 一般来说,变换关系可以含有广义速度。如果变换可以由某个(某些)参数来参数化,且这些参数可以连续取值,则被称作连续变换(continuous transformation)。对于连续变换,当变换参数为无穷小量时,被称作无穷小变换(infintesimal transformation)。对于时间参数,其无穷小变换为

δst=t~t(5.46)\delta_s t=\tilde t-t\tag{5.46}

这里的 δs\delta_s 代表对称变换。广义坐标的无穷小变换定义为

δsqa(t):=q~a(t)qa(t)(5.47)\delta_sq^a(t):=\tilde q^a(t)-q^a(t) \tag{5.47}

虽然 δsqa\delta_sq^aδqa\delta q^a 在数学形式上一样,但其并不是任意的变分,而是满足某些条件的连续变换。我们还定义

Δqa(t):=q~a(t~)qa(t)(5.48)\Delta q^a(t):=\tilde q^a(\tilde t)-q^a(t)\tag{5.48}

以上 3 个无穷小变换 δst\delta_s tδsq\delta _s qΔqa\Delta q^a 的关系如下图所示

由式(5.46)和(5.47),展开得到

Δqa(t)=q~a(t+δst)qa(t)=q~a(t)+δStq~˙a(t)qa(t)\Delta q^a(t)=\tilde q^a(t+\delta_s t)-q^a(t)=\tilde q^a(t)+\delta_S t\dot{\tilde q}^a(t)-q^a(t)

带入 q~˙a=q˙a+ddt(δsqa)\dot{\tilde q}^a=\dot q^a+\frac{\mathrm d}{\mathrm dt}(\delta_s q^a) 并保留一阶小量,得到

Δqa(t)=δsqa+δstq˙a(5.49)\Delta q^a(t)=\delta_s q^a+\delta_st\dot q^a\tag{5.49}

可见 δst\delta _s tδsqa\delta_s q^aΔqa\Delta q^a 中只有 2 个是独立的。式(5.49)也可以由上图直观理解。定义

Δq˙a(t):=dq~a(t~)dt~dqa(t)dt=dtdt~ddt(qa(t)+Δqa(t))q˙a(t)(5.50)\Delta\dot q^a(t):=\frac{\mathrm d \tilde q^a(\tilde t)}{\mathrm d\tilde t}-\frac{\mathrm dq^a(t)}{\mathrm dt}= \frac{\mathrm dt}{\mathrm d\tilde t}\frac{\mathrm d}{\mathrm dt}(q^a(t)+\Delta q^a(t))-\dot q^a(t) \tag{5.50}

带入式(5.49),展开并保留到一阶小量,得到

Δq˙a(t)=dtdt~ddt(qa(t)+Δqa(t))q˙a(t)=(1d(δst)dt~)ddt(qa+δsqa+δstq˙a)q˙a=ddt(δsqa)+δstq¨a(5.51)\begin{aligned} \Delta \dot q^a(t)&=\frac{\mathrm dt}{\mathrm d\tilde t}\frac{\mathrm d}{\mathrm dt}(q^a(t)+\Delta q^a(t))-\dot q^a(t)\\ &=\left(1-\frac{\mathrm d(\delta_st)}{\mathrm d\tilde t} \right)\frac{\mathrm d}{\mathrm dt}(q^a+\delta_sq^a+\delta_st\dot q^a)-\dot q^a\\ &=\frac{\mathrm d}{\mathrm dt}(\delta_sq^a)+\delta_st\ddot q^a \end{aligned} \tag{5.51}

注意 Δq˙addt(Δqa)\Delta \dot q^a\neq\frac{\mathrm d}{\mathrm dt}(\Delta q^a)

5.5.3 作用量的对称性

​ 在式(5.44)和(5.55)的变换下,作用量的变换定义为

ΔS:=S~[q~]S[q]=t~1t~2dt~L(t~,q~,dq~dt~)t1t2dtL(t,q,q˙)(5.52)\begin{aligned} \Delta S:&=\tilde S[\boldsymbol{\tilde {q}}]-S[\boldsymbol q]\\ &=\int _{\tilde t_1}^{\tilde t_2}\mathrm d\tilde tL(\tilde t,\tilde {\boldsymbol q},\frac{\mathrm d\tilde{\boldsymbol q}}{\mathrm d\tilde t})-\int_{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q}) \end{aligned} \tag{5.52}

若要求作用量在变换下严格不变,则 ΔS0\Delta S\equiv 0 。但根据 5.4.1 节的讨论,两个作用量可以在相差边界项的意义下等价,即给出相同的运动方程。因此如果

ΔS=t1t2dtdFdt(5.53)\Delta S=\int_{t_1}^{t_2}\mathrm dt\frac{\mathrm dF}{\mathrm dt}\tag{5.53}

则变换被称作对称变换(symmetry transformation),而称作用量在此变换下不变(invariant)。此时系统所有的性质在此变换下不变,又因为变换参数可以连续取值,所以对称性被称作连续对称性(continuous symmetry)。需要强调的是,我们只是在讨论变换 δst\delta_s tδsqa\delta_s q^a 导致变换量形式的改变,而完全没有管运动方程是否满足(即 qa(t)q^a(t) 的函数形式如何)。无论运动方程是否满足,式(5.53)都必须成立,这样的变换才是系统的一个对称性。这体现了对称性式系统的内在属性,与运动方程是否满足(真实运动)没有关系。

​ 在无穷小变换式(5.46)和(5.48)下,利用式(5.49)和(5.51),将 ΔS\Delta S 展开并保留到一阶小量

ΔS=t1t2dtdt~dtL~(t~,q~(t~),dq~(t~)dt~)t1t2dtL(t,q,q˙)=t1t2dt(1+δstdt)L~(t+δst,q+δsq+δstq˙,q˙+d(δsq)dt+(δst)q¨)t1t2dtL(t,q,q˙)=t1t2dt(1+d(δst)dt)[L+Ltδst+Lqa(δsqa+δstq˙a)+Lq˙a(d(δsqa)dt+(δst)q¨a)]t1t2dtL=t1t2dt[Lqaδsqa+Lq˙ad(δsqa)dt=ddt(Lq˙aδsqa)ddtLq˙aδsqa+Ld(δst)dt+(Lt+Lqaq˙a+Lq˙aq¨a)=dLdtδst](5.54)\begin{aligned} \Delta S&=\int_{t_1}^{t_2}\mathrm dt\frac{\mathrm d\tilde t}{\mathrm dt}\tilde L(\tilde t,\tilde{\boldsymbol q}(\tilde t),\frac{\mathrm d\tilde{\boldsymbol q}(\tilde t)}{\mathrm d\tilde t}) -\int _{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\\ &=\int_{t_1}^{t_2}\mathrm dt\left(1+\frac{\delta_s t}{\mathrm dt} \right)\tilde L\left(t+\delta_st,\boldsymbol q+\delta_s\boldsymbol q+\delta_st\dot{\boldsymbol q},\dot{\boldsymbol q}+\frac{\mathrm d(\delta_s \boldsymbol q)}{\mathrm dt}+(\delta_st)\ddot{\boldsymbol q}\right)-\int_{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\\ &=\int_{t_1}^{t_2}\mathrm dt\left(1+\frac{\mathrm d(\delta_s t)}{\mathrm dt} \right)\left[ L+\frac{\partial L}{\partial t}\delta_st+\frac{\partial L}{\partial q^a}(\delta_sq^a+\delta_st\dot q^a)\right. \quad \left.+\frac{\partial L}{\partial \dot q^a}\left(\frac{\mathrm d(\delta_s q^a)}{\mathrm dt}+(\delta_st)\ddot q^a \right) \right]-\int_{t_1}^{t_2}\mathrm dtL\\ &=\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial q^a}\delta_sq^a+\underbrace{\frac{\partial L}{\partial \dot q^a}\frac{\mathrm d(\delta_sq^a)}{\mathrm dt}}_{=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a \right)-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}\delta_sq^a} +L\frac{\mathrm d(\delta_st)}{\mathrm dt}+\underbrace{\left(\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\partial L}{\partial \dot q^a}\ddot q^a \right)}_{=\frac{\mathrm dL}{\mathrm dt}}\delta_s t\right]\\ \end{aligned} \tag{5.54}

整理得到

ΔS=t1t2dt[(LqaddtLq˙a)δsqa+ddt(Lq˙aδsqa+Lδst)](5.55)\Delta S=\int_{t_1}^{t_2}\mathrm dt\left[\left(\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm d t}\frac{\partial L}{\partial \dot q^a} \right)\delta_sq^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_st \right) \right]\tag{5.55}

式(5.55)即是在变换下,作用量的变换。根据对称变换的定义式(5.53),即要求

(LqaddtLq˙a)δsqa+ddt(Lq˙aδsqa+Lδst)=dFdt(5.56)\left(\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm d t}\frac{\partial L}{\partial \dot q^a} \right)\delta_sq^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_st \right) =\frac{\mathrm dF}{\mathrm dt} \tag{5.56}

这里的 FF 与具体的对称变换有关。式(5.56)是在变换式(5.46)和(5.47)下作用量不变,即使对称变换的充分必要条件,被称为诺特条件(Noether condition)。

​ 在式(5.56)中,第二项已经是时间全导数的形式,特别是时间变换 δst\delta_s t 的贡献总是对时间全导数的形式。所以式(5.56)成立仅对 δsqa\delta_sq^a 的形式做出要求。第一项的 LqaddtLq˙aδSδqa\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}\equiv \frac{\delta S}{\delta q^a} 对于欧拉-拉格朗日方程。于是式(5.56)可以改写成更方便也更有意义的形式

δSδqaδsqa=dQdt(5.57)-\frac{\delta S}{\delta q^a}\delta_s q^a=\frac{\mathrm d\mathcal Q}{\mathrm dt}\tag{5.57}

这里

Q:=paδsqa+LδstF(5.58)\mathcal Q:=p_a\delta_sq^a+L\delta_st-F \tag{5.58}

其中 pap_a 为广义动量。诺特条件可以写成其他等价形式,例如利用式(5.49),式(5.58)还可以写成

Q=paΔqahδstF(5.59)\mathcal Q=p_a\Delta q^a-h\delta_st-F\tag{5.59}

其中 hLq˙aq˙aLh\equiv \frac{\partial L}{\partial \dot q^a}\dot q^a-L 即能量函数。

5.6 诺特定理

5.6.1 诺特定理的证明

​ 现在假设已经找到了作用量的一个对称变换,当运动方程满足的时候,式(5.57)的左边为零,于是得到

dQdtδSδqaδsqa=满足运动方程时0(5.60)\frac{\mathrm d\mathcal Q}{\mathrm dt}\equiv-\frac{\delta S}{\delta q^a}\delta_sq^a\xlongequal{满足运动方程时}0 \tag{5.60}

亦即

dQdt=0(5.61)\frac{\mathrm d\mathcal Q}{\mathrm dt}=0\tag{5.61}

从而

Q=Lq˙aδsqa+LδstF=const(5.62)Q=\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_s t-F=const \tag{5.62}

注意 QQ 和对称变换的参数有关,因此 QQ 本身还不是运动常数,因为运动常数定义为时间、广义坐标和广义速度的函数。

​ 但是有一个特殊,当变换参数与时间参数 tt 无关时,变换被称作整体变换(global transformation)。在单参数情形,即有

δst=ϵη(t,q,q˙)(5.63)\delta_st=\epsilon\eta(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.63}

δsqa=ϵξa(t,q,q˙),a=1,,s(5.64)\delta_sq^a=\epsilon\xi^a(t,\boldsymbol q,\dot{\boldsymbol q}),\quad a=1,\cdots,s \tag{5.64}

其中 ϵ\epsilon 是和时间参数 tt 无关的无穷小常数,η\etaξa\xi^a 则一般是时间 tt 、广义坐标及广义速度的函数。相应的边界项记为

F=ϵφ(t,q,q˙)(5.65)F=\epsilon\varphi(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.65}

对于整体对称性,因为变换参数 ϵ\epsilon 是常数,可以将其提出,定义

Q:=1ϵQ=1ϵ(Lq˙aϵξa+Lϵηϵφ)(5.66)Q:=\frac 1\epsilon \mathcal Q=\frac{1}{\epsilon}\left(\frac{\partial L}{\partial \dot q^a}\epsilon \xi^a+L\epsilon \eta-\epsilon \varphi \right) \tag{5.66}

式(5.62)即意味着

QLq˙aξa+Lηφ=const(5.67)Q\equiv \frac{\partial L}{\partial \dot q^a}\xi^a+L\eta-\varphi=const \tag{5.67}

其是之和时间、广义坐标和广义速度有关的运动常数。式(5.67)对多个参数情形的推广是直接的。

​ 从而我们得到诺特定理(Noether’s theorem):若系统的作用量具有连续整体对称性,则当运动方程满足时,存在相应的运动常数。注意诺特定理成立的前提有三:

(1)对称性是连续对称性,所以才有无穷小变换的概念;

(2)对称性是整体对称性,即变换参数是常数(与 tt 无关);

(3)运动常数只存在于满足运动方程的真实演化过程中。

5.6.2 时空对称性

​ 考虑 NN 个粒子的系统,空间坐标的无穷小整体平移即

δξx(α)=ϵξ^(5.68)\delta_{\boldsymbol\xi}\boldsymbol x_{(\alpha)}=\epsilon\hat{\boldsymbol\xi}\tag{5.68}

其中 ξ^\hat{\boldsymbol \xi} 是常单位矢量。因为只是空间坐标的平移,时间参数不变所以 δst=0\delta_s t=0 。同时拉格朗日量严格不变,所以边界项 F=0F=0 。由式(5.68)得到运动常数

Q=α=1NLx˙(α)ξ^=α=1Np(α)ξ^=const(5.69)Q=\sum_{\alpha=1}^{N}\frac{\partial L}{\partial \dot{\boldsymbol x}_{(\alpha)}}\cdot\hat{\boldsymbol \xi}=\sum_{\alpha=1}^N \boldsymbol p_{(\alpha)}\cdot\hat{\boldsymbol \xi}=const \tag{5.69}

即总动量在 ξ^\hat{\boldsymbol \xi} 方向的分量守恒。

​ 同样,空间坐标的无穷小整体转动即

δξx(α)=ϕn×x(α)(5.70)\delta_{\boldsymbol \xi}\boldsymbol x_{(\alpha)}=\phi\boldsymbol n\times \boldsymbol x_{(\alpha)} \tag{5.70}

其中 ϕ\phi 为无穷小转角。和整体平移的情形一样,有 δst=0\delta_st=0F=0F=0 。代入式(5.67)得到运动常数

Q=α=1NLx˙(α)(n×x(α))=α=1Nn(x(α)×p(α))=const(5.71)Q=\sum_{\alpha=1}^N\frac{\partial L}{\partial \dot{\boldsymbol x}_{(\alpha)}}\cdot(\boldsymbol n\times \boldsymbol x_{(\alpha)})=\sum_{\alpha=1}^N\boldsymbol n\cdot\left(\boldsymbol x_{(\alpha)}\times\boldsymbol p_{(\alpha)} \right)=const\tag{5.71}

即总角动量在 n\boldsymbol n 方向的分量守恒。

​ 时间的无穷小整体平移对应

δst=η(5.72)\delta_st=\eta\tag{5.72}

其中 η\eta 为无穷小常数。假设广义坐标式时间变换下的标量,

qa(t)q~a(t~)qa(t)(5.73)q^a(t)\to\tilde q^a(\tilde t)\equiv q^a(t)\tag{5.73}

Δqa=0\Delta q^a=0,由式(5.49)得到

δsqa=ηq˙a(5.74)\delta_sq^a=-\eta\dot q^a\tag{5.74}

要求作用量严格不变所以 F=0F=0 。代入式(5.67)得到运动常数

Q=Lq˙a(q˙a)+L=h=const(5.75)Q=\frac{\partial L}{\partial \dot q^a}(-\dot q^a)+L=-h=const \tag{5.75}

即能量守恒。

Example 5.13 一维阻尼谐振子的运动常数

​ 一维阻尼谐振子的运动方程可以由拉格朗日量 L=eλt(12mq˙212mω2q2)L=e^{\lambda t}\left(\frac12 m\dot q^2-\frac12m\omega^2q^2\right) 得到,其中 λ\lambda 为常数。考虑变换

tt~=t+α,q(t)q~(t~)=eλα2q(t)(5.76)t\to\tilde t=t+\alpha,\quad q(t)\to \tilde q(\tilde t)=e^{-\frac{\lambda \alpha}{2}}q(t)\tag{5.76}

其中 α\alpha 是常数。可以验证,在此变换下

S~[q~]=t~1t~2dt~eλt~[12m(dq~(t~)dt~)212mω2q~2]=t1t2dteλ(t+α)(12meλαq˙212mω2eλαq2)=t1t@dteλt(12mq˙212mω2q2)S[q]\begin{aligned} \tilde S[\tilde q]&=\int_{\tilde t_1}^{\tilde t_2} \mathrm d\tilde te^{\lambda\tilde t}\left[\frac12m\left(\frac{\mathrm d\tilde q(\tilde t)}{\mathrm d\tilde t}\right)^2-\frac12m\omega^2\tilde q^2 \right]\\ &=\int_{t_1}^{t_2}\mathrm dte^{\lambda(t+\alpha)}\left(\frac12me^{-\lambda\alpha}\dot q^2-\frac12m\omega^2e^{-\lambda\alpha}q^2 \right)\\ &=\int_{t_1}^{t_@}\mathrm dte^{\lambda t}\left(\frac12m\dot q^2-\frac12m\omega^2q^2 \right)\equiv S[q] \end{aligned}

其作用量严格不变。因为变换参数 α\alpha 是常数,所以变换式(5.76)是系统的整体对称性,为了应用诺特定理,首先令 αϵ\alpha\to \epsilon 为无穷小参数,得到无穷小变换

tt~=t+ϵ,q(t)q~(t~)=q(t)ϵλ2q(t)t\to\tilde t=t+\epsilon,\quad q(t)\to\tilde q(\tilde t)=q(t)-\epsilon\frac \lambda2 q(t)

δst=ϵΔq=ϵλ2q\delta_s t=\epsilon,\quad \Delta q=-\epsilon\frac\lambda 2q

由式(5.49)又得到

δsq=Δqδstq˙=ϵλ2qϵq˙\delta_sq=\Delta q-\delta_st\dot q=-\epsilon\frac \lambda 2q-\epsilon \dot q

于是对应式(5.73)和(5.74)即

η=1,ξ=λ2qq˙\eta=1,\quad \xi=-\frac \lambda 2q-\dot q

因为作用量严格不变,所以边界项 φ0\varphi\equiv0 。代入式(5.77)中得到运动常数

Q=Lq˙(λ2qq˙)+L=eλtmq˙(λ2q˙)+eλt(12mq˙212mω2q2)=eλt2(mq˙2+mλqq˙+mω2q2)\begin{aligned} Q&=\frac{\partial L}{\partial \dot q}\left(-\frac\lambda 2q-\dot q\right)+L=e^{\lambda t}m\dot q\left(-\frac\lambda 2-\dot q \right)+e^{\lambda t}\left(\frac 12m\dot q^2-\frac 12m\omega^2q^2 \right)\\ &=-\frac{e^{\lambda t}}{2}\left(m\dot q^2+m\lambda q\dot q+m\omega^2q^2 \right) \end{aligned}

Example 5.12 整体 U(1)\mathrm U(1) 对称性

​ 平面上运动的粒子的拉格朗日量为 L=12m(x˙2+y˙2)λ2(x2+y2)L=\frac 12m(\dot x^2+\dot y^2)-\frac \lambda 2(x^2+y^2) 。定义 ϕ=x+iy\phi=x+\mathbf i yϕ=xiy\phi^*=x-\mathbf iy ,则拉格朗日量可以写成 L=12mϕ˙2λ2ϕ2L=\frac 12m|\dot \phi|^2-\frac{\lambda}{2}|\phi|^2 。考虑变换

ϕϕ~=eiαϕ,ϕϕ~=eiαϕ(5.77)\phi\to\tilde\phi=e^{\mathbf i\alpha}\phi,\quad \phi^{*}\to\tilde\phi^*=e^{-\mathbf i\alpha}\phi^*\tag{5.77}

其中 α\alpha 是常数。式(5.77)是相位的变换,数学上构成所谓 U(1)\mathrm U(1) 群。在变换下

LL~=12mϕ~˙2λ2ϕ~2LL\to\tilde L=\frac 12m|\dot{\tilde\phi}|^2-\frac{\lambda}{2}|\tilde \phi|^2 \equiv L

即拉格朗日量是不变的。又因 α\alpha 是常数,所以式(5.77)是系统的整体 U(1)\mathrm U(1) 对称性。为了应用诺特定理,令 αϵ\alpha \to \epsilon 为无穷小参数,无穷小变换即为

δsϕ=iϵϕ,δsϕ=iϵϕ\delta_s\phi=\mathbf i\epsilon \phi,\quad \delta_s\phi^*=-\mathbf i\epsilon \phi^*

变换不涉及时间的变换,所以 δst=0\delta_st=0 。同时拉格朗日量严格不变,所以边界项 φ=0\varphi=0 。代入式(5.67)中,得到运动常数

QLϕ˙iϕ+Lϕ˙(iϕ)=im(ϕ˙ϕϕ˙ϕ)Q\equiv\frac{\partial L}{\partial \dot\phi}\mathbf i\phi+\frac{\partial L}{\partial \dot \phi^*}(-\mathbf i\phi^*)=\mathbf im(\dot \phi^*\phi-\dot \phi\phi^*)

为了看出这一运动常数的物理意义,将 ϕ\phiϕ\phi^* 代回直角坐标 xxyy ,得到

im(ϕ˙ϕϕ˙ϕ)=im[(x˙iy˙)(x+iy)(x˙+iy˙)(xiy)]=2m(xy˙yx˙)\mathbf im(\dot\phi^*\phi-\dot\phi\phi^*)=\mathbf im[(\dot x-\mathbf i\dot y)(x+\mathbf iy)-(\dot x+\mathbf i\dot y)(x-\mathbf iy)]=2m(x\dot y-y\dot x)

这里的 m(xy˙yx˙)m(x\dot y-y\dot x) 的物理意义正是粒子绕原点的角动量。整体 U(1)\mathrm U(1) 对称性正对应 2 维平面上的转动不变性,所以自然有角动量守恒。

Example 5.13 动力学对称

​ 考虑 DD 维欧氏空间中各向同性谐振子,取直角坐标 {xi}\{x^i\} ,拉格朗日量维 L=12mx2˙12mω2x2L=\frac12m\dot{\boldsymbol x^2}-\frac 12m\omega^2\boldsymbol x^2 。这一拉格朗日量当然具有时间平移和坐标整体转动的不变性。除此之外,其还具有额外的对称性。考虑无穷小变换

δ(kl)xi=ϵ12(x˙kδli+x˙lδki),i=1,,D(5.78)\delta_{(kl)} x^i=\epsilon \frac 12(\dot x_k\delta_l^i+\dot x_l\delta^i_k),\quad i=1,\cdots,D\tag{5.78}

这里 ϵ\epsilon 为变换参数; k,lk,l 为给定指标,即对于每个 k,lk,l 的值,都有一个相应的变换,因为变换参数 ϵ\epsilon 是常数,所以这个变换是整体变换。对式(5.78)求时间导数有

δ(kl)x˙i=ϵ12(x¨kδli+x¨lδki),i=1,,D\delta_{(kl)}\dot x^i=\epsilon\frac12(\ddot x_k\delta_{l}^i+\ddot x_l\delta_k^i),\quad i=1,\cdots,D

于是在这个变换下

δ(kl)(x˙2)=2x˙iδ(kl)xi=ϵx˙i(x¨kδli+x¨lδki)=ϵ(x˙lx¨k+x˙kx¨l)=ϵddt(x˙kx˙l)\delta_{(kl)}(\dot{\boldsymbol x}^2)=2\dot x_i\delta_{(kl)}x^i=\epsilon \dot x_i(\ddot x_k\delta_l^i+\ddot x_l\delta_k^i)=\epsilon(\dot x_l\ddot x_k+\dot x_k\ddot x_l)=\epsilon\frac{\mathrm d}{\mathrm dt}(\dot x_k\dot x_l)

同样

δ(kl)(x2)=2xiδklxi=ϵxi(x˙kδli+x˙lδki)=ϵddt(xkxl)\delta_{(kl)}(\boldsymbol x^2)=2x_i\delta_{kl}x^i=\epsilon x_i(\dot x_k\delta_l^i+\dot x_l\delta_k^i)=\epsilon \frac{\mathrm d}{\mathrm dt}(x_kx_l)

于是作用量的变换为

Δ(kl)S=dt(12mδ(kl)(x˙2)12mω2δ(kl)(x2))=dtϵddt(12mx˙kx˙l12mω2xkxl)\begin{aligned} \Delta_{(kl)}S&=\int \mathrm dt\left(\frac 12m\delta_{(kl)}(\dot{\boldsymbol x}^2)-\frac 12m\omega^2\delta_{(kl)}(\boldsymbol x^2) \right)\\ &=\int \mathrm dt\epsilon\frac{\mathrm d}{\mathrm dt}\left(\frac12m\dot x_k\dot x_l-\frac 12m\omega^2 x_kx_l\right) \end{aligned}

可见在变换式(5.78)下,作用量不变,且得到非零边界项

F(kl)=ϵ(12mx˙lx˙l12mω2xkxl)F_{(kl)}=\epsilon(\frac12m\dot x_l\dot x_l-\frac 12m\omega^2x_kx_l)

变换不涉及时间,所以 δst0\delta_s t\equiv0 。根据诺特定理,存在运动常数

Q(kl)=1ϵ(Lx˙iδ(kl)xiF(kl))=1ϵ[mx˙iϵ12(x˙kδli+x˙lδki)ϵ(12mx˙kx˙l12mω2xkxl)]=12mx˙kx˙l+12mω2xkxl\begin{aligned} Q_{(kl)}&=\frac{1}{\epsilon}\left(\frac{\partial L}{\partial \dot x^i}\delta_{(kl)}x^i-F_{(kl)} \right)\\ &=\frac 1\epsilon\left[m\dot x_i\epsilon \frac 12(\dot x_k\delta_l^i+\dot x_l\delta_k^i)-\epsilon(\frac 12m\dot x_k\dot x_l-\frac12 m\omega^2x_kx_l) \right]\\ &=\frac 12m\dot x_k\dot x_l+\frac 12m\omega^2x_kx_l \end{aligned}

Q(kl)Q_{(kl)} 对于 k,lk,l 指标对称,对于 DD 维空间,有 12D(D+1)\frac 12D(D+1) 个独立分量。变换式(5.78)不是时间和空间坐标纯几何的变换,特别是变换中涉及速度,被称为动力学对称(dynamical symmetry)。在这个简单的例子中,变换式(5.78)对应哈密顿量在幺正变换的不变性。

5.6.3 标度对称性

​ 物理学中还有一种重要的整体对称性,即变量的整体缩放

tt~=eβt,qa(t)=q~(t~)=eαqa(t)(5.79)t\to \tilde t=e^\beta t,\quad q^a(t)\to=\tilde q(\tilde t)=e^\alpha q^a(t) \tag{5.79}

其中 α,β\alpha,\beta 是无量纲的常数,被称作标度变换(scale transformation)。恒等变换即对应 α=β=0\alpha=\beta=0 。标度变换相当于选取不同的单位(即标度)来衡量物理量。如果物理系统的作用量在标度变换下不变,则称其有标度不变性。

​ 对于定常系统,由式(4.47)作用量为

S[q]=dt(12Gab(q)q˙aq˙bV(q))(5.80)S[\boldsymbol q]=\int \mathrm dt\left(\frac 12G_{ab}(\boldsymbol q)\dot q^a\dot q^b-V(\boldsymbol q) \right)\tag{5.80}

在标度变换式(5.79)下,作用量变换为

S~[q~]=dt~(12Gab(q~)dq~adt~dq~bdt~V(q~))=dteβ(12Gab(eαq)e2(αβ)q˙aq˙bV(eαq))\begin{aligned} \tilde S[\tilde{\boldsymbol q}]&=\int \mathrm d\tilde t\left(\frac 12G_{ab}(\tilde{\boldsymbol q})\frac{\mathrm d\tilde q^a}{\mathrm d\tilde t}\frac{\mathrm d\tilde q^b}{\mathrm d\tilde t}-V(\tilde{\boldsymbol q}) \right)\\ &=\int \mathrm dte^\beta\left(\frac{1}2G_{ab}(e^\alpha\boldsymbol q)e^{2(\alpha-\beta)}\dot q^a\dot q^b- V(e^\alpha\boldsymbol q)\right) \end{aligned}

一般来说作用量并没有标度不变性。如果 Gab(q)G_{ab}(\boldsymbol q)V(q)V(\boldsymbol q) 都是广义坐标的齐次函数(homogeneous function),即对于任意常数 λ\lambda

Gab(λq)=λkGab(q),V(λq)=λpV(q)(5.81)G_{ab}(\lambda \boldsymbol q)=\lambda^kG_{ab}(\boldsymbol q),\quad V(\lambda \boldsymbol q)=\lambda^pV(\boldsymbol q)\tag{5.81}

其中 k,pk,p 是常数,于是

S~=dt(12Gab(q)e(2+k)αβq˙aq˙bepα+βV(q))\tilde S=\int \mathrm dt\left(\frac12G_{ab}(\boldsymbol q)e^{(2+k)\alpha-\beta}\dot q^a\dot q^b-e^{p\alpha+\beta}V(\boldsymbol q) \right)

作用量不变要求

(2+k)αβ=0,pα+β=0(5.82)(2+k)\alpha-\beta=0,\quad p\alpha+\beta=0\tag{5.82}

从中得到 k,pk,p 满足的条件

2+k+p=0(5.83)2+k+p=0 \tag{5.83}

​ 总之,定常系统式(5.80)具有标度不变性要求

Gab(λq)=1λ2+pGab(q),V(λq)=λpV(q)(5.84)G_{ab}(\lambda \boldsymbol q)=\frac {1}{\lambda^{2+p}}G_{ab}(\boldsymbol q),\quad V(\lambda \boldsymbol q)=\lambda^pV(\boldsymbol q)\tag{5.84}

其中 pp 为常数,由式(5.83)的第二式,相应的标度变换为

tt~=epαt,qa(t)q~a(t~)=eαqa(t)(5.85)t\to\tilde t=e^{-p\alpha}t,\quad q^a(t)\to\tilde q^a(\tilde t)=e^\alpha q^a(t) \tag{5.85}

其中 α\alpha 是常数。

Exercise 5.10

​ 已知非相对论极限下磁场中带电粒子的拉格朗日量为 L=12mv2+ecvAL=\frac{1}{2}m\boldsymbol v^2+\frac{e}{c}\boldsymbol v\cdot \boldsymbol A ,其中 cc 是光速, ee 是电荷, vx˙\boldsymbol v\equiv \dot{\boldsymbol x} 是粒子的速度, A\boldsymbol A 是失势。假设 A=12B×x\boldsymbol A=\frac 12\boldsymbol B\times \boldsymbol x,其中 B=Bez\boldsymbol B=B\boldsymbol e_zzz 方向的均匀磁场。

​ (1)求粒子的运动方程,证明其具有 v˙=v×ω\dot{\boldsymbol v}=\boldsymbol v\times \boldsymbol \omega 的形式。

​ (2)写出拉格朗日量在柱坐标 {r,ϕ,z}\{r,\phi,z\} 中的形式,证明虽然 ϕ\phi 是循环坐标,但是角动量的 zz 分量 Jzmr2ϕ˙J_z\equiv mr^2\dot \phi 却并不是运动常数,并解释其原因。

proof

(1)

ddtLviLxi=ddt(mvi+ecAi)ecvjAjxi=mv¨i+ecvj(AixjAjxi)=0(5.86)\begin{aligned} \frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial v^i}-\frac{\partial L}{\partial x^i}&=\frac{\mathrm d}{\mathrm dt}( mv_i+\frac{e}{c}A_i)-\frac{e}{c}v^j\cdot\frac{\partial A_j}{\partial x^i} \\ &=m\ddot v_i+\frac{e}{c}v^j\left(\frac{\partial A_i}{\partial x^j}-\frac{\partial A_j}{\partial x^i} \right)=0 \end{aligned} \tag{5.86}

因为 Bk=(×A)k=ϵkmnmAn\boldsymbol B^k=(\nabla \times\boldsymbol A)^k=\epsilon^{kmn}\partial_mA_n ,因此

ϵijkBk=ϵijkϵkmnmAn=(δimδjnδinδjm)mAn=AjxiAixj\epsilon_{ijk}B^k=\epsilon_{ijk}\epsilon^{kmn}\partial_mA_n=(\delta_i^m\delta_j^n-\delta_i^n\delta_j^m)\partial_mA_n=\frac{\partial A_j}{\partial x^i}-\frac{\partial A_i}{\partial x^j}

所以式(5.87)可以写成

mv¨i=ecϵijkvjBkm\ddot v_i=\frac{e}{c}\epsilon_{ijk}v^jB^k

mv¨=v×ecBm\ddot{\boldsymbol v}=\boldsymbol v\times \frac{e}{c}\boldsymbol B

(2)

v2=r˙2+r2ϕ˙2+z˙2vA=12Bez(v×x)=12Br2ϕ˙\boldsymbol v^2=\dot r^2+r^2\dot \phi^2+\dot z^2\\ \boldsymbol v\cdot \boldsymbol A=\frac 12 B\boldsymbol e_z\cdot(\boldsymbol v\times \boldsymbol x)=\frac 12 Br^2\dot\phi

所以

L=12m(r˙2+r2ϕ˙2+z˙2)e2cBr2ϕ˙L=\frac{1}{2}m(\dot r^2+r^2\dot\phi ^2+\dot z^2)-\frac{e}{2c}Br^2\dot\phi

显然 ϕ\phi 是循环坐标。

pϕ=Lϕ=mr2ϕ˙e2cBr2=constp_{\phi}=\frac{\partial L}{\partial \phi}=mr^2\dot\phi-\frac{e}{2c}Br^2=const

所以角动量的 zz 分量 JzJ_z 不是运动常数。因为洛伦兹力会产生力矩。

Chapter 6 辅助变量

6.1 拉格朗日乘子法

​ 对于有约束的系统,虽然作用量的变分仍是

δS[q]dt(ddtLq˙aLqa)δqa\delta S[\boldsymbol q]\simeq-\int\mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a} \right)\delta q^a

但是由于 δqa\delta q^a 不是相互独立,所以无法确定出 ss 个独立的运动方程。对于这样的已知约束的系统,有一个标准且有效的处理方法,即拉格朗日乘子法(method of Lagrange multipliers)。

6.1.1 函数的条件极值

​ 对于二元函数 F=F(x,y)F=F(x,y),以及约束 ϕ(x,y)=0\phi(x,y)=0FF 取极值的条件为

dF=Fxdx+Fydy=0(6.1)\mathrm dF=\frac{\partial F}{\partial x}\mathrm dx+\frac{\partial F}{\partial y}\mathrm dy=0\tag{6.1}

F=λϕ(6.2)\nabla F=-\lambda\nabla \phi \tag{6.2}

其中 λ\lambda 为常数,即拉格朗日乘子(Largrange multiplier)。由此问题可以转化为 3 元函数

F~(x,y,λ)F(x,y)+λϕ(x,y)(6.3)\tilde F(x,y,\lambda)\equiv F(x,y)+\lambda\phi(x,y)\tag{6.3}

在将 x,y,λx,y,\lambda 视为 3 个独立变量的情况下的极值条件,即

dF~=F~xdx+F~ydy+F~ϕdϕ=(Fx+λϕx)dx+(Fy+λϕy)dy+ϕdλ(6.4)\mathrm d\tilde F=\frac{\partial \tilde F}{\partial x}\mathrm dx+\frac{\partial \tilde F}{\partial y}\mathrm dy+\frac{\partial \tilde F}{\partial \phi}\mathrm d\phi=\left(\frac{\partial F}{\partial x}+\lambda\frac{\partial \phi}{\partial x} \right)\mathrm dx+\left(\frac{\partial F}{\partial y}+\lambda\frac{\partial \phi}{\partial y} \right)\mathrm dy+\phi\mathrm d\lambda\tag{6.4}

6.1.2 完整约束

​ 简单起见,只考虑存在 1 个完整约束的情形,约束方程为

ϕ(t,q)=0(6.5)\phi(t,\boldsymbol q)=0 \tag{6.5}

对于多个完整约束的推广是直接的。完整约束式(6.5)诱导出广义坐标变分之间的关系

δϕ=ϕqaδqa(6.6)\delta \phi=\frac{\partial \phi}{\partial q^a}\delta q^a \tag{6.6}

由于泛函导数 δSδqa\frac{\delta S}{\delta q^a} 相当于作用量 SS 在位形空间中的“梯度”,因此取极值时应该有

δSδqa=λϕqa,a=1,,s(6.7)\frac{\delta S}{\delta q^a}=-\lambda \frac{\partial \phi}{\partial q^a},\quad a=1,\cdots,s\tag{6.7}

这里的拉格朗日乘子 λ(t)\lambda(t) 一般也是时间参数 tt 的函数,但是和 {q}\{\boldsymbol q\}{q˙}\{\dot{\boldsymbol q}\} 无关。得到"“拓展”"后的作用量

S~[λ,q]=dt[L(t,q,q˙)+λ(t)ϕ(t,q)]\tilde S[\lambda,\boldsymbol q]=\int \mathrm dt\left[L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda(t)\phi(t,\boldsymbol q) \right]

写出对于的 s+1s+1 个欧拉-拉格朗日方程:

ddtL~q˙aL~qa=ddtLq˙aLqaλϕqa,a=1,,s(6.8)\frac{\mathrm d}{\mathrm dt}\frac{\partial \tilde L}{\partial \dot q^a}-\frac{\partial \tilde L}{\partial q^a}=\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a}-\lambda\frac{\partial \phi}{\partial q^a},\quad a=1,\cdots,s\tag{6.8}

ddtL~λ˙L~λ=ϕ=0(6.9)\frac{\mathrm d}{\mathrm dt}\frac{\partial\tilde L}{\partial \dot \lambda}-\frac{\partial \tilde L}{\partial \lambda}=-\phi=0 \tag{6.9}

与多元函数情形一样,将拉格朗日乘子 λ\lambda 视为一个独立变量,其运动方程就是约束方程。

Example 6.2 用拉格朗日乘子法求解二维球面上的自由粒子

​ 考虑半径为 RR 的球面,一粒子约束在球面上运动,忽略摩擦和重力。这个问题中粒子的自由度为 2 ,可以直接取球面坐标 {θ,ϕ}\{\theta,\phi \} 。这里我们取 3 维直角坐标,约束即

ϕ(x,y,z)=x2+y2+z2R2=0\phi(x,y,z)=x^2+y^2+z^2-R^2=0

为完整约束。应用拉格朗日乘子法写出作用量

S[x,y,z,λ]=dt[12m(x˙2+y˙2+z˙2)λ(x2+y2+z2R2)]S[x,y,z,\lambda]=\int\mathrm dt\left[\frac 12m(\dot x^2+\dot y^2+\dot z^2)-\lambda(x^2+y^2+z^2-R^2) \right]

变分得到 x,y,zx,y,z 的运动方程

mx¨2λx=0,my¨2λy=0,mz¨2λz=0m\ddot x-2\lambda x=0,\quad m\ddot y-2\lambda y=0,\quad m\ddot z-2\lambda z=0

以及约束方程 ϕ(x,y,z)=0\phi(x,y,z)=0 ,一共 4 个方程,对应 4 个未知变量,可以得到 x¨x=y¨y=z¨z=2λm\frac{\ddot x}{x}=\frac{\ddot y}{y}=\frac{\ddot z}{z}=\frac{2\lambda}{m} ,因为 x,y,zx,y,z 都是独立变量,其成立条件当且仅当拉格朗日乘子 λ\lambda 取常数。

对约束式求时间导数得到

ϕ˙=2xx˙+2yy˙+2zz˙=2xx˙=0\dot \phi=2x\dot x+2y\dot y+2z\dot z=2\boldsymbol x\cdot\dot{\boldsymbol x}=0

上式意味粒子的速度切于球面。上式再求时间导数得到 x˙2+xx¨=0\dot {\boldsymbol x}^2+\boldsymbol x\cdot \ddot {\boldsymbol x}=0 ,代入前面的式子中得到

x˙2=2λmR2\dot{\boldsymbol x}^2=-\frac{2\lambda}{m}R^2

根据上面分析, $\lambda $ 为常数,使上式有意义必须要求 λ<0\lambda \lt 0 。实际上,上式即 E12mx˙2=λR2E\equiv \frac 12m\dot{\boldsymbol x}^2=-\lambda R^2 。在 3 维直角坐标下,粒子有 3 个自由度,状态空间由 {x,v}\{\boldsymbol x,\boldsymbol v\} 共 6 个变量描述。球面给出这 6 个变量的 3 个约束 x2=R2\boldsymbol x^2=R^2xx˙=0\boldsymbol x\cdot \dot{\boldsymbol x}=0v2=2Em\boldsymbol{v}^2=\frac{2E}{m} ,其中能量 EE 待定,因此独立变量的个数为 6+13=46+1-3=4 ,这与球面上粒子的自由度为 12×4=2\frac 12\times 4=2 也是自洽的。

6.1.3 非完整约束

​ 由以上讨论知,拉格朗日乘子法的关键在于约束可以视为位形空间中的曲面,从而给出如式(6.6)的广义坐标变分的线性关系。这对于非完整系统一般是不成立的,因此拉格朗日乘子法一般不能推广到非完整系统。对于形如 ϕ(t,q,q˙)=0\phi(t,\boldsymbol q,\dot{\boldsymbol q})=0 的非完整约束,写出作用量

dt[L(t,q,q˙)+λ(t)ϕ(t,q,q˙)](6.10)\int \mathrm dt\left[L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda(t)\phi(t,\boldsymbol q,\dot{\boldsymbol q}) \right] \tag{6.10}

并将 {q}\{\boldsymbol q\}λ\lambda 视为独立变量做变分,并不能得到非完整系统正确的运动方程,即作用量式(6.10)并不能正确描述非完整系统。实际上,一般的非完整系统并不能纳入最小作用量的框架内。

​ 一个例外是当非完整约束具有如下形式

ϕ(t,q,q˙)=Aa(t,q)q˙a+B(t,q)=0(6.11)\phi(t,\boldsymbol q,\dot{\boldsymbol q})=A_a(t,\boldsymbol q)\dot q^a+B(t,\boldsymbol q)=0\tag{6.11}

即只包含广义速度的“线性项”时,拉格朗日乘子法也是适用的。这是因为式(6.11)意味着 ϕdt=Aadqa+Bdt\phi \mathrm dt=A_a\mathrm dq^a+B\mathrm dt 。在任一瞬时(dt=0\mathrm dt=0),广义坐标的变分即满足关系

Aadqa=0(6.12)A_a\mathrm dq^a=0\tag{6.12}

这具有和式(6.6)同样的形式,只是式(6.6)中的“梯度” ϕqa\frac{\partial \phi}{\partial q^a} 被换成了一般的“矢量” AaA_a 。仿照完整约束的思路,即要求泛函的梯度 δSδqa\frac{\delta S}{\delta q^a}AaA_a 成正比

δSδqa=λAa(6.13)\frac{\delta S}{\delta q^a}=-\lambda A_a\tag{6.13}

等价的,即要求

d(δL+λAaδqa)=0(6.14)\int \mathrm d\left(\delta L+\lambda A_a\delta q^a \right)=0\tag{6.14}

即得到运动方程

ddtLq˙aLqa=λAa.a=1,,s(6.15)\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a}=-\lambda A_a.\quad a=1,\cdots ,s\tag{6.15}

完整约束的式(6.8)可以认为是式(6.15)中 AaϕqaA_a\to \frac{\partial \phi}{\partial q^a} 的特殊情况。

​ 还有一种非完整约束是以积分形式给出的,例如

dtϕ(t,q,q˙)=C=const(6.16)\int \mathrm dt\phi(t,\boldsymbol q,\dot {\boldsymbol q})=C=const \tag{6.16}

这类约数被称为等周约束(isoperimetric constraint)。等周约束也可以用拉格朗日乘子法处理。这是因为等周约束式(6.18)的积分是一个常数,而作用量加上常数不影响极值,所以

S取极值    (S+λdtϕ)取极值(6.17)S取极值 \iff \left(S+\lambda\int\mathrm dt\phi\right)取极值\tag{6.17}

这里拉格朗日乘子法 λ\lambda 必须是个常数。因此,对于等周约束式(6.16),应用拉格朗日乘子法即相当于对于扩展的作用量

S~[q]=dt(L+λϕ)=dt(L(t,q,q˙)+λϕ(t,q,q˙))(6.18)\tilde S[\boldsymbol q]=\int \mathrm dt(L+\lambda\phi)=\int \mathrm dt(L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda\phi(t,\boldsymbol q,\dot{\boldsymbol q})) \tag{6.18}

在将 {q}\{\boldsymbol q\} 全部视为独立的情况下,求变分极值。对于等周约束,拉格朗日乘子法 $\lambda $ 是个常数(其值待定),不参与变分。

Example 6.5 包围最大面积的定长封闭曲线为圆周

​ 取平面直角坐标,平面上的曲线参数化为 x=x(s),y=y(s)x=x(s),y=y(s) ,这里 ss 是曲线的参数。封闭曲线所围面积为

A=12C(xdyydx)=12Cds(xy˙yx˙)A=\frac 12\oint_C(x\mathrm dy-y\mathrm dx)=\frac 12\oint_C\mathrm ds(x\dot y-y\dot x)

这里 x˙dxds,y˙dyds\dot x\equiv \frac{\mathrm dx}{\mathrm ds},\dot y\equiv\frac{\mathrm dy}{\mathrm ds} 。设曲线长度固定为 CC ,对于的等周约束即

Cdx2+dy2=Cdsx˙2+y˙2=C\oint_C\sqrt{\mathrm dx^2+\mathrm dy^2}=\oint_C \mathrm ds\sqrt{\dot x^2+\dot y^2}=C

于是拉格朗日乘子法要求泛函

A+λC=Cds[12(xy˙yx˙)+λx˙2+y˙2]A+\lambda C=\oint _C\mathrm ds\left[\frac 12(x\dot y-y\dot x)+\lambda\sqrt{\dot x^2+\dot y^2} \right]

在将 xxyy 视为独立变量的情况下取极值。对 xx 变分得到方程(注意 λ\lambda 为常数)

y˙λdds(x˙x˙2+y˙2=0)yλx˙x˙2+y˙2=y0\dot y-\lambda\frac{\mathrm d}{\mathrm ds}\left(\frac{\dot x}{\sqrt{\dot x^2+\dot y^2}}=0 \right)\quad \Rightarrow\quad y-\lambda\frac{\dot x}{\sqrt{\dot x^2+\dot y^2}}=y_0

同理,对 yy 变分得到

xλy˙x˙2+y˙2=x0x-\lambda \frac{\dot y}{\sqrt{\dot x^2+\dot y^2}}=x_0

这里 x0x_0y0y_0 是常数。由上两式可以得到 (xx0)2+(yy0)2=λ2(x-x_0)^2+(y-y_0)^2=\lambda^2,这是一个以 (x0,y0)(x_0,y_0) 为圆心,半径为 λ\lambda 的圆。拉格朗日乘子法亦即半径 λ\lambda 的值由等周约束方程给出。

Example 6.6 最大熵概率分布

​ 孤立系统在平衡态的概率分布是的系统的熵取极大值,被称作最大熵概率分布(maximum entropy probability distribution)。假设系统处于某个能量 EE 的概率密度为 ρ(E)\rho(E) ,则系统的熵为 S[ρ]=dEρlnρS[\rho]=\int \mathrm dE\rho\ln \rho 。孤立系统需要满足两个约束条件:其一是总能量守恒,dEρE=E=const\int \mathrm dE\rho E=\Epsilon=const ;其二是概率密度的归一化条件, dEρ=1\int \mathrm dE\rho=1 。两个约束条件以积分形式出现,可视为等周约束。因此,使得熵取极值的概率分布即要求泛函

S~[ρ]=dEρlnρ+βdEρE+λdEρ\tilde S[\rho]=\int \mathrm dE\rho\ln \rho+\beta\int \mathrm dE\rho E+\lambda\int \mathrm dE\rho

取极值,这里 β\betaλ\lambda 为拉格朗日乘子,都是常数。对 ρ\rho 变分得到 δS~=dR(lnρ+1+βE+λ)δρ=0\delta \tilde S=\int \mathrm dR(\ln \rho+1+\beta E+\lambda)\delta \rho=0 ,从中解出 ρ=eλ1eβE\rho=e^{-\lambda-1}e^{-\beta E} 。这正是著名的玻尔兹曼分布(Boltzmann distribution)。

Chapter 7 微分变分原理

7.1 达朗贝尔原理

7.1.1 虚位移与虚功

​ 按照牛顿力学的观念,一切影响运动的因素都归结为力。既然运动被约束限制,这种限制自然也归结为所谓约束力(constraint force),即迫使力学系统遵循约束条件的力。相应地,和约束无关的力(即约束消失仍然存在)被称为主动力(applied force)。约束力这个概念虽然很直接,却带来了技术上的复杂性。运动方程中1的约束力不能预先确定,是未知量的一部分,只能用运动方程和约束方程联合求解。

​ 作为一种变分原理,达朗贝尔原理将广义坐标的变分称作虚位移(virtual displacement),即系统在任意的瞬时,满足约束条件的无穷小位移。力(包括主动力和约束力)在虚位移下所做的功即虚功(virtual work)。考虑 NN 个粒子构成的粒子系统。第 α\alpha 个粒子受到的主动力记为 F(α)\boldsymbol F_{(\alpha)} ,约束力记为 N(α)\boldsymbol N_{(\alpha)} 。则第 α\alpha 个粒子主动力的虚构即 N(α)δx(α)\boldsymbol N_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)} 。某个粒子的虚位移平行于约束面,约束力则垂直于约束面,即虚位移与约束力总是垂直的 Nδx=0\boldsymbol N\cdot \delta \boldsymbol x=0 。受此启发,如果系统所有粒子受约束力所做的虚功之和为零,即

α=1NN(α)δx(α)=0(7.1)\sum_{\alpha=1}^N \boldsymbol N_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)}=0\tag{7.1}

则该系统的约束称为理想约束(ideal constraint)。注意,理想约束是系统所受全部约束的一个整体性质,而不是某一个或某几个约束的性质。以下我们只讨论理想约束。

7.1.2 达朗贝尔原理的表述

​ 达朗贝尔原理的出发点是牛顿运动方程。考虑 NN 个粒子组成的粒子系统。每一个粒子都满足牛顿第二定理 F(α)+N(α)=m(α)x¨(α)\boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}=m_{(\alpha)}\boldsymbol{\ddot{x}}_{(\alpha)} ,即

F(α)+N(α)m(α)x¨(α)=0,α=1,,N(7.2)\boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot{x}}_{(\alpha)}=0,\quad \alpha=1,\cdots,N\tag{7.2}

在牛顿力学中, m(α)x¨(α)-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} 可视为第 α\alpha 个质点所受的惯性力(inertial force)。设第 α\alpha 个粒子的虚位移为 δx(α)\delta \boldsymbol x_{(\alpha)} 。将式(7.2)与 δx(α)\delta \boldsymbol x_{(\alpha)} 作点乘,并对所有粒子求和,得到

α=1N(F(α)+N(α)m(α)x¨(α))δx(α)=0(7.3)\sum_{\alpha=1}^N \left(\boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\cdot\delta \boldsymbol x_{(\alpha)}=0\tag{7.3}

而由理想约束条件式(7.1)知,系统约束力总的虚功为零,因此

α=1N(F(α)+m(α)x¨(α))δx(α)=0(7.4)\sum_{\alpha=1}^N\left(\boldsymbol F_{(\alpha)}+m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\delta x_{(\alpha)}=0 \tag{7.4}

式(7.4)意味着理想约束系统所受主动力和惯性力产生的总虚功为零,这就是达朗贝尔原理(d’Alembert principle)。在达朗贝尔原理中,约束力在方程中不再出现,从而化简了计算。达朗贝尔原理式(7.4)有一个简单的几何解释。因为虚位移 δx(α)\delta \boldsymbol x_{(\alpha)} 总是满足约束,即平行于约束面的,因此式(7.3)相当于牛顿运动方程(7.2)在平行于约束面方向的投影。而理想约束的约束力 N(α)\boldsymbol N_{(\alpha)} 可以认为是垂直于约束面的,因此在投影之下自然消失了,即得到式(7.4)。

​ 如果系统已经达到平衡状态,即有 x(α)=const\boldsymbol x_{(\alpha)}=const ,因此 x¨(α)=0\ddot{\boldsymbol x}_{(\alpha)}=0 。这时,达朗贝尔原理式(7.4)意味着

α=1NF(α)δx(α)=0(7.5)\sum_{\alpha=1}^N \boldsymbol F_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)}=0 \tag{7.5}

即系统达到平衡的条件是所有主动力所做虚功之和为零,也被称作虚功原理(principle pf virtual work)。

Example 7.1 用虚功原理来求解平衡问题

​ 如图所示,四根长度为 ll 的硬杆用无摩擦的铰链连接,系统的位移由广义坐标 θ\theta 完全确定。若左右方向收到力 F1F_1 的挤压,上下方向收到力 F2F_2 的挤压。建立直角坐标,由几何关系 xA=lcosθ,xB=lcosθ,yC=lsinθx_A=-l\cos\theta,x_B=l\cos\theta,y_C=-l\sin\thetayD=lsinθy_D=l\sin\theta ,则虚功原理要求

0δWA+δWB+δWC+δWD=F1δxAF1δxB+F2δyCF2δyD=2l(F1sinθF2cosθ)δθ\begin{aligned} 0\equiv &\delta W_A+\delta W_B+\delta W_C+\delta W_D=F_1\delta x_A-F_1\delta x_B+F_2\delta y_C-F_2\delta y_D\\ =&2l\left(F_1\sin\theta-F_2\cos \theta \right)\delta \theta \end{aligned}

即要求 F1sinθF2cosθ=0F_1\sin\theta-F_2\cos\theta=0 ,因此达到平衡时满足 θ=arctanF2F1\theta=\arctan\frac{F_2}{F_1} 。相比受力分析的做法,用虚功原理可以更便捷地求解平很问题。

7.2 由达朗贝尔原理导出拉格朗日方程

​ 通过达朗贝尔原理,可以将牛顿第二定律改造成拉格朗日方程的形式。由于约束的存在,各个粒子的虚位移 δx(α)\delta \boldsymbol x_{(\alpha)} 不独立,所以从式(7.4)并不能得到

F(α)m(α)x¨(α)=0,α=1,,N\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)}=0,\quad \alpha=1,\cdots,N

的结论。因此,首先需要对达朗贝尔原理用独立的广义坐标表达。对于 NN 个粒子组成的系统,假设存在 kk 个完整约束,于是可以选取 s=3Nks=3N-k 个独立的广义坐标 {qa},a=1,,s\{q^a\},a=1,\cdots,s 。第 α\alpha 个粒子的直角坐标 x(α)\boldsymbol x_{(\alpha)} 用广义坐标 {q}\{\boldsymbol q\} 表示为 x(α)=x(α)(t,q)\boldsymbol x_{(\alpha)}=\boldsymbol x_{(\alpha)}(t,\boldsymbol q) 。直角坐标的虚位移为

δx(α)=x(α)qaδqa,α=1,,N(7.6)\delta \boldsymbol x_{(\alpha)}=\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\delta q^a,\quad \alpha=1,\cdots,N \tag{7.6}

将式(7.6)代入式(7.4)得到

α=1N(F(α)m(α)x¨(α))x(α)qaδqa=0\sum_{\alpha=1}^N(\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol {\ddot x}_{(\alpha)})\cdot \frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\delta q^a=0

ss 个广义坐标是相互独立的,因此上式的成立要求每一个 δqa\delta q^a 前面的系数都为零 ,即得到 ss 个独立的方程

α=1N(F(α)m(α)x¨(α))x(α)qa=0,a=1,,s\sum_{\alpha=1}^N\left(\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=0,\quad a=1,\cdots,s

α=1Nm(α)x¨(α)x(α)qa=α=1NF(α)x(α)qa,a=1,,s(7.7)\sum_{\alpha=1}^N m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a},\quad a=1,\cdots,s\tag{7.7}

其中

左边=ddt(α=1Nm(α)x˙(α)x(α)qa)α=1Nm(α)x˙(α)ddt(x(α)qa)=ddt(α=1Nm(α)x˙(α)x(α)qa)α=1Nm(α)x˙(α)x˙(α)qa=ddtqa(12α=1Nm(α)x˙(α)2)Tqa(12α=1Nm(α)x˙(α)2)T\begin{aligned} 左边&=\frac{\mathrm d}{\mathrm dt}\left(\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)-\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\mathrm d}{\mathrm dt} \left(\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)\\ &=\frac{\mathrm d}{\mathrm dt}\left(\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)-\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot \frac{\partial \boldsymbol {\dot x}_{(\alpha)}}{\partial q^a} \\ &=\frac{\mathrm d}{\mathrm dt}\frac{\partial }{\partial q^a}\underbrace{\left(\frac 12\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}^2_{(\alpha)} \right)}_{T}-\frac{\partial }{\partial q^a}\underbrace{\left(\frac 12\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}^2 \right)}_{T} \end{aligned}

左边=ddt(Tqa)Tqa(7.8)左边=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial q^a}\right)-\frac{\partial T}{\partial q^a}\tag{7.8}

对于式(7.7)的右边,定义广义力

右边=α=1NF(α)x(α)qaQa(7.9)右边=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\equiv Q_a \tag{7.9}

因为广义坐标不必是长度量纲,所以广义力也不必是力的量纲,最终我们得到一组完全用独立的广义坐标表达的动力学方程

ddt(Tqa)Tqa=Qa,a=1,,s(7.10)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial q^a} \right)-\frac{\partial T}{\partial q^a}=Q_a,\quad a=1,\cdots,s\tag{7.10}

式(7.10)即拉格朗日方程。

7.2.1 保守系统

​ 当系统所受主动力全部都是保守力(conservative force)时,

F(α)=Vx(α)(7.11)\boldsymbol F_{(\alpha)}=-\frac{\partial V}{\partial \boldsymbol x_{(\alpha)}}\tag{7.11}

这里 V=V(x(1),,x(N))V(q)V=V(\boldsymbol x_{(1)},\cdots,\boldsymbol x_{(N)})\equiv V(\boldsymbol q) 是势能,只依赖与系统的位形。式(7.10)中的广义力可以写成

Qa=α=1NF(α)x(α)qa=α=1NVx(α)x(α)qaVqaQ_a=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=-\sum_{\alpha=1}^N\frac{\partial V}{\partial x_{(\alpha)}}\cdot \frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\equiv\frac{\partial V}{\partial q^a}

代入式(7.10)得到

ddt(Tq˙a)Tqa=Vqa(7.12)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial \dot q^a} \right)-\frac{\partial T}{\partial q^a}=-\frac{\partial V}{\partial q^a}\tag{7.12}

ddt(Tq˙a)(TV)qa=0(7.13)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial \dot q^a} \right)-\frac{\partial (T-V)}{\partial q^a}=0\tag{7.13}

因为势能与广义速度无关, Tq˙a(TV)q˙a\frac{\partial T}{\partial \dot q^a}\equiv\frac{\partial(T-V)}{\partial \dot q^a} 。因此,若定义 LTVL\equiv T-V ,式(7.13)可以进一步写成

ddt(Lq˙a)Lqa=0,a=1,,s(7.14)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\frac{\partial L}{\partial q^a}=0,\quad a=1,\cdots,s\tag{7.14}

式(7.14)即是完整、保守系统的拉格朗日方程,其中 LTVL\equiv T-V 即拉格朗日量。这里也再次看出,拉格朗日量为牛顿力学的动能减去势能。

Chapter 8 两体问题

8.1 两体系统

​ 两个相互作用的粒子组成的封闭系统即两体系统。研究两体系统的运动问题即所谓两体问题(two-body problem)。通常两体问题有严格解。

​ 两体问题可分为三类。一种情况是两个粒子不会无限分离,保持有限距离,被称为束缚态(bound state)。另一种情况是两个粒子从无穷远处靠近,经相互作用改变彼此的运动状态,之后又相互分离至无穷远,被称作碰撞(collision)或散射(scattering)。还有一种情况是两粒子经过相互作用合二为一,或者一个例子一分为二,被称为俘获(capture)或衰变(decay)。

8.1.1

​ 设两粒子的质量分别为 m1m_1m2m_2 ,空间位置用直角坐标记为 x1\boldsymbol x_1x2\boldsymbol x_2 。两体系统的动能为

T=12m1x˙12+12m2x˙22(8.1)T=\frac 12m_1\dot {\boldsymbol x}_1^2+\frac 12m_2\dot{\boldsymbol x}_2^2\tag{8.1}

相互作用势能为 V=V(x1,x2)V=V(\boldsymbol x_1,\boldsymbol x_2) ,只和两个粒子的空间位置有关。由空间对称性,可以对势能的形式作进一步的要求,

V(x1,x2)=V(x1x2)(8.2)V(\boldsymbol x_1,\boldsymbol x_2)=V(\boldsymbol x_1-\boldsymbol x_2)\tag{8.2}

即空间均匀性决定相互作用势能只和相对位置有关。如果进一步要求空间是各向同性的,即在任意转动下也不变,则势能具有形式

V(x1x2)=V(x1x2)(8.3)V(\boldsymbol x_1-\boldsymbol x_2)=V(|\boldsymbol x_1-\boldsymbol x_2|)\tag{8.3}

即只和两粒子的相对距离大小有关,和方向无关。

​ 总之,在空间均匀和各向同性的要求下,两体系统的拉格朗日量为

L=12m1x˙1+12m2x˙22V(x1x2)(8.4)L=\frac 12m_1\dot{\boldsymbol x}_1+\frac 12m_2\dot{\boldsymbol x}_2^2-V(|\boldsymbol x_1-\boldsymbol x_2|) \tag{8.4}

对于两体系统,由于相互作用势能 V(x1x2)V(|\boldsymbol x_1-\boldsymbol x_2|) 的存在,两个粒子之间产生的关系,被称作耦合(coupled)。

8.1.2 两体系统的退耦

​ 以两体各自的坐标 x1,x2\boldsymbol x_1,\boldsymbol x_2 为变量,两体系统的运动方程是耦合在一起的,但我们可以选取新的广义坐标使得两体系统退耦(decoupled),即等效为两个相互独立的单粒子的运动。

​ 考虑与 {x1,x2}\{\boldsymbol x_1,\boldsymbol x_2\} 满足线性关系的一组新的坐标 {y1,y2}\{\boldsymbol y_1,\boldsymbol y_2\} ,线性变换关系为

(x1x2)=(abcd)(y1y2)(8.5)\begin{pmatrix} \boldsymbol x_1\\ \boldsymbol x_2 \end{pmatrix} = \begin{pmatrix} a&b\\ c&d \end{pmatrix} \begin{pmatrix} \boldsymbol y_1\\ \boldsymbol y_2 \end{pmatrix} \tag{8.5}

其中 a,b,c,da,b,c,d 为常数。在式(8.5)的变换下,动能项变为

T=12(x1x2)(m100m2)(x1x2)=12(y1y2)(m1a2+m2c2m1ab+m2cdm1ab+m2cdm1b2+m2d2)(y1y2)(8.6)\begin{aligned} T&=\frac 12 \begin{pmatrix} \boldsymbol x_1 & \boldsymbol x_2 \end{pmatrix} \begin{pmatrix} m_1 & 0\\ 0 & m_2 \end{pmatrix} \begin{pmatrix} \boldsymbol x_1\\ \boldsymbol x_2 \end{pmatrix}\\ &=\frac 12 \begin{pmatrix} \boldsymbol y_1 & \boldsymbol y_2 \end{pmatrix} \begin{pmatrix} m_1a^2+m_2c^2 & m_1ab+m_2cd\\ m_1ab+m_2cd & m_1b^2+m_2d^2 \end{pmatrix} \begin{pmatrix} \boldsymbol y_1\\ \boldsymbol y_2 \end{pmatrix} \end{aligned} \tag{8.6}

如果要求用新的变量 y1,y2\boldsymbol y_1,\boldsymbol y_2 表达的动能项时退耦的,就必须要求非对角元为零,即

m1ab+m2cd=0(8.7)m_1ab+m_2cd=0\tag{8.7}

由式(8.5),相互作用的势能项变为 V=V((ac)y1+(bd)y2)V=V(|(a-c)\boldsymbol y_1+(b-d)\boldsymbol y_2 |) 。因此,如果要求势能式退耦的,则只能是 a=ca=cb=db=d 。不失一般性,不妨取

a=c(8.8)a=c\tag{8.8}

​ 同时满足式(8.7)和(8.8)的线性变换的一般形式为

(y1y2)=(1axc1bm2m1+m2r)(8.9)\begin{pmatrix} \boldsymbol y_1\\ \boldsymbol y_2 \end{pmatrix} = \begin{pmatrix} \frac 1a\boldsymbol x_c\\ \frac 1b \frac{m_2}{m_1+m_2}\boldsymbol r \end{pmatrix} \tag{8.9}

其中 a,ba,b 为任意常数,这里自然出现了两体系统的质心位置 xc\boldsymbol x_c 和两粒子的相对位矢 r\boldsymbol r ,定义

xc:=m1x1+m2x2m1+m2,r=x1x2(8.10)\boldsymbol x_c:=\frac{m_1\boldsymbol x_1+m_2\boldsymbol x_2}{m_1+m_2},\quad \boldsymbol r=\boldsymbol x_1-\boldsymbol x_2\tag{8.10}

简单起见,不妨取 a=1,b=m2m1+m2a=1,b=\frac{m_2}{m_1+m_2} 。即有 y1=xc\boldsymbol y_1=\boldsymbol x_cy2=r\boldsymbol y_2=\boldsymbol r 。此时动能项成为

T=12(xcr)(mt00mr)(xcr)(8.11)T=\frac12 \begin{pmatrix} \boldsymbol x_c & \boldsymbol r \end{pmatrix} \begin{pmatrix} m_t & 0 \\ 0 & m_r \end{pmatrix} \begin{pmatrix} \boldsymbol x_c \\ \boldsymbol r \end{pmatrix}\tag{8.11}

其中, mtm_t 为两体系统的总质量

mtm1+m2(8.12)m_t\equiv m_1+m_2 \tag{8.12}

mrm_r 被称为约化质量(reduced mass)

mrm1m2m1+m2(8.13)m_r\equiv\frac{m_1m_2}{m_1+m_2} \tag{8.13}

相互作用势能项为 V=V(x1x2)=V(r)V=V(|\boldsymbol x_1-\boldsymbol x_2|)=V(r) ,只是两粒子相对距离,即相对位矢大小 rrr\equiv|\boldsymbol r| 的函数,也是完全退耦的。

​ 总之,在空间均匀和各向同性的假设下,两体系统可以完全退耦,即约化为两个单粒子的运动,分别对应两体系统的质心运动与相对运动。其质心运动的拉格朗日量为

Lc=12mcx˙c2(8.14)L_c=\frac 12m_c\dot{\boldsymbol x}_c^2\tag{8.14}

其等效于质量为 mtm_t 的自由粒子。相对运动的拉格朗日量为

Lr=12mrr˙2V(r)(8.15)L_r=\frac 12m_r\dot{\boldsymbol r}^2-V(r)\tag{8.15}

等效于位于中心势场 V(r)V(r) 中质量为 mrm_r 的粒子。

8.2 中心势场

8.2.1 中心势场中的运动

​ 两体系统的质心作匀速直线运动,因此我们重点关注两体系统的相对运动,即单粒子在中心势场中的运动。记 mmrm\equiv m_r ,拉格朗日量式(8.15)的运动方程为

mr¨=V(8.16)m\ddot{\boldsymbol r}=-\nabla V\tag{8.16}

r=rrr^\nabla r=\frac{\boldsymbol r}{r}\equiv\hat r ,式(8.16)又可以写成

mr¨=V(r)rr(8.17)m\ddot{\boldsymbol r}=-V'(r)\frac{\boldsymbol r}{r}\tag{8.17}

欧式空间中梯度算符定义为 =eixi\nabla=\boldsymbol e^i\frac{\partial }{\partial x^i},所以

r=eirxi=rr\nabla r=\boldsymbol e^i \frac{\partial r}{\partial x^i}=\frac{\boldsymbol r}{r}

V=eiVxi=Vreirxi=Vrr\nabla V=\boldsymbol e^i \frac{\partial V}{\partial x^i}=\frac{\partial V}{\partial r} \boldsymbol e^i\frac{\partial r}{\partial x^i}=V'\frac{\boldsymbol r}{r}

​ 中心势场具有球对称性,因此更方便的是选取球坐标 {r,θ,ϕ}\{r,\theta,\phi\} ,于是式(8.15)成为

L=12m(r˙2+r2θ˙2+r2sin2θϕ˙2)V(r)(8.18)L=\frac 12 m\left(\dot r^2+r^2\dot\theta^2+r^2\sin^2\theta\dot \phi^2 \right)-V(r) \tag{8.18}

式(8.18)即是中心势场中粒子的拉格朗日量。

​ 拉格朗日量式(8.18)不含 ϕ\phi ,即 ϕ\phi 是循环坐标,于是其共轭动量是运动常数

pϕLϕ˙=mr2sin2θϕ˙=const=Jz(8.19)p_\phi\equiv\frac{\partial L}{\partial \dot \phi}=mr^2\sin^2\theta\dot \phi=const=\boldsymbol J_z\tag{8.19}

由于空间各向同性,所以 zz 轴可以任取,说明中心势场中粒子的角动量矢量守恒

J=const(8.20)\boldsymbol J=const \tag{8.20}

​ 中心势场中粒子的角动量守恒意味着中心势场中的粒子必做平面运动。因为角动量矢量的定义为

J=r×p(8.21)\boldsymbol J=\boldsymbol r\times\boldsymbol p\tag{8.21}

意味着相对中心的位矢 r\boldsymbol r 和动量 p\boldsymbol p 都和角动量垂直,换句话说,粒子的运动完全处于和角动量矢量 J\boldsymbol J 垂直的平面内。

​ 既然如此,可取平面极坐标 {r,ϕ}\{r,\phi \} 进一步简化计算。这时式(8.18)变成

L=12m(r˙2+r2ϕ˙2)V(r)(8.22)L=\frac 12m(\dot r^2+r^2\dot \phi^2)-V(r) \tag{8.22}

这时 ϕ\phi 是循环坐标。共轭动量是运动常数

pϕmr2ϕ˙2=constJ(8.23)p_\phi\equiv mr^2\dot \phi^2=const\equiv J \tag{8.23}

​ 拉格朗日量式(8.22)不显含时间,能量函数为运动常数

h12m(r˙2+r2ϕ˙2)+V(r)=const=E(8.24)h\equiv \frac 12m(\dot r^2+r^2\dot \phi^2)+V(r)=const=E\tag{8.24}

对于中心势场的粒子,因为动能是广义速度的二次型,所以 EE 即粒子的总能量。

​ 以上我们得到中心势场中的粒子的两个运动常数,角动量大小为 JJ 和总能量 EE ,由式(8.23)和(8.24)消去 ϕ˙\dot \phi ,得到

E=12mr˙2+J22mr2+V(r)(8.25)E=\frac 12m\dot r^2+\frac {J^2}{2mr^2}+V(r) \tag{8.25}

这是关于径向坐标 r=r(t)r=r(t) 的单变量方程,且是一个一阶方程。由式(8.25)解出 r˙\dot r

drdt=±2m(EV(r))J22mr2(8.26)\frac{\mathrm dr}{\mathrm dt}=\pm\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}\tag{8.26}

积分得到

t=±dr2m(EV(r))J22mr2(8.27)t=\pm\int\frac{\mathrm dr}{\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}}\tag{8.27}

给定势能 V(r)V(r) ,原则上由式(8.27)可以积出得到 t=t(r)t=t(r) ,亦即径向坐标随时间的演化 r=r(t)r=r(t) 。再代入式(8.23),即得到

ϕ=ϕ(t)=dtJmr2(t)(8.28)\phi=\phi(t)=\int\mathrm dt\frac{J}{mr^2(t)} \tag{8.28}

即角坐标随时间的变化关系。由式(8.23)和(8.26)消去 dt\mathrm dt ,得到

mr2Jdϕ=±dr2m(EV(r))J22mr2(8.29)\frac{mr^2}{J}\mathrm d\phi=\pm\frac{\mathrm dr}{\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}} \tag{8.29}

对上式积分,即可得到轨迹方程 r=r(ϕ)r=r(\phi) 。遗憾的是,只有少数几种数学形式的 V(r)V(r) ,才能使式(8.29)得到解析结果。

8.2.2 定性讨论

​ 由式(8.23)解得

ϕ˙=J2mr2(8.30)\dot \phi=\frac{J}{2mr^2}\tag{8.30}

由之可得到如下定性结论:因为角动量守恒,且 J>0J>0 ,因此 ϕ\phi 总是随时间单调变化,即粒子总是朝一个方向运动而不会回转。另一方面,式(8.30)意味着 ϕ˙1r2\dot \phi \propto \frac{1}{r^2} ,即距离中心越近转得越快,距离中心越远,转的越慢。这正是角动量守恒,亦即势能与动能相互转化的结果。

​ 由式(8.25)知,径向运动可以看成单粒子在有效势能

Veff(r)=V(r)+J22mr2(8.31)V_{\mathrm{eff}}(r)=V(r)+\frac{J^2}{2mr^2}\tag{8.31}

中的一维运动,其中 J22mr2\frac{J^2}{2mr^2} 可视为有效的离心势能。

​ 由式(8.25)得到

12mr˙2=EVeff(r)=EJ22mr2V(r)0(8.32)\frac 12m\dot r^2=E-V_{\mathrm{eff}}(r)=E-\frac{J^2}{2mr^2}-V(r)\ge 0\tag{8.32}

因此总能量不小于有效势能,即 EVeff(r)E\ge V_{\mathrm{eff}}(r) 。在总能量给定的情况下,径向坐标 rr 的运动范围由 r˙=0\dot r=0 ,即方程

EJ22mr2V(r)=0(8.33)E-\frac{J^2}{2mr^2}-V(r)= 0\tag{8.33}

决定。此方程的零点即轨道的转变点。

8.2.3 贝特朗定理

​ 对于有界运动,由式(8.29)知,在从 r1r_1r2r_2 ,再回到 r1r_1 的这一往复过程中,角度变化为

Δϕ=2t1t2Jr2dr2m(EV(r))J2r2(8.34)\Delta \phi=2\int_{t_1}^{t_2}\frac{J}{r^2}\frac{\mathrm dr}{\sqrt{2m(E-V(r))-\frac{J^2}{r^2}}} \tag{8.34}

若经过 nn 个周期的往复,轨道闭合,即满足

nΔϕ=m2π,m,n=1,2,3,(8.35)n\Delta \phi=m2\pi,\quad m,n=1,2,3,\cdots \tag{8.35}

对于一般的中心势场,有界运动的轨道都不闭合,此时经过无限长的时间,轨道铺满 r1r_1r2r_2 之间的圆环,如图所示

​ 数学上可以证明,只有

V1r2,Vr2(8.36)V\propto -\frac{1}{r^2},\quad V\propto r^2 \tag{8.36}

两种形式的中心势场,有限远动的轨道才是闭合的。这个结论即所谓贝特朗定理(Bertrand‘s theorem)。

8.3 开普勒问题

​ 到中心的距离成反比的中心势场

V(r)=αr(8.37)V(r)=-\frac \alpha r\tag{8.37}

是最常见也是最重要的一种势场,其中 α>0\alpha>0 对应吸引势,α<0\alpha<0 对应排斥势,对这一系统的求解称为开普勒问题(Kepler problem)。以下我们假定 α>0\alpha >0 。由式(8.31)知径向运动的有效势能为

Veff=αr+J22mr2(8.38)V_{\mathrm{eff}}=-\frac \alpha r+\frac{J^2}{2mr^2}\tag{8.38}

有效势能在 Veff=0V'_{\mathrm{eff}}=0 处存在极值,对应

rm=J2mα(3.39)r_m=\frac{J^2}{m\alpha} \tag{3.39}

且由于 Veff(rm)=α4m3J6>0V''_{\mathrm{eff}}(r_m)=\frac{\alpha^4m^3}{J^6}>0 ,所以是极小值,对应 (Veff)min=Veff(rm)=α2m2J2(V_{\mathrm{eff}})_{\min}=V_{\mathrm{eff}}(r_m)=-\frac{\alpha^2m}{2J^2} 。此外,有效势能曲线存在零点 Veff(r)=0V_{\mathrm{eff}}(r)=0 ,对应 r0=J22mαr_0=\frac{J^2}{2m\alpha}

8.3.1 开普勒问题的求解

​ 如图所示,根据系统能量的大小,可以将粒子的运动定性分为两类。当 (Veff)minE<0(V_{\mathrm{eff}})_{\min}\le E<0 时,式(8.33)有两个零点。粒子限制于 r1rr2r_1\le r\le r_2 的环状区域做有界运动,这种状态即束缚态。 r1r_1 被称作近日点(preihelion), r2r_2 被称为远日点(aphelion)。当 r1=r2=rmr_1=r_2=r_m 时,即 E=(Veff)minE=(V_{\mathrm{eff}})_{\min} ,轨道为半径 rmr_m 的正圆。当 E0E\ge0 时,式(8.33)有一个零点。此时存在近日点 r1r_1 ,但是不存在远日点。粒子可以运动至无穷远,因此做半无界运动。

​ 由式(8.29)可知,轨道方程即

ϕ(r)=Jmr2dr2m(E+αr)J2m2r2(8.40)\phi(r)=\int \frac{J}{mr^2}\frac{\mathrm dr}{\sqrt{\frac 2m\left(E+\frac \alpha r \right)-\frac{J^2}{m^2r^2}}} \tag{8.40}

引入

p:=J2mα,e:=1+2EJ2mα2(8.41)p:=\frac{J^2}{m\alpha},\quad e:=\sqrt{1+\frac{2EJ^2}{m\alpha^2}} \tag{8.41}

其中 pp 被称作半通径(semi latus rectum),ee 被称作偏心率(eccentricity)。积分式(8.40)可以解析积出

ϕ=drpr21e2(1pr)2=u=1prdue2u2=arcsin(ue)+ϕ0(8.42)\phi=\int\mathrm dr\frac p{r^2}\frac{1}{\sqrt{e^2-\left(1-\frac pr\right)^2}}\xlongequal{u=1-\frac pr}\int\frac{\mathrm du}{\sqrt{e^2-u^2}}=\arcsin\left(\frac ue \right)+\phi_0 \tag{8.42}

这里 ϕ0\phi_0 是积分常数,方便起见取 ϕ0=π2\phi_0=\frac \pi2 。于是轨道方程可以写成 u=ecosϕu=-e\cos\phi ,即

r(ϕ)=p1+ecosϕ(8.43)r(\phi)=\frac{p}{1+e\cos\phi}\tag{8.43}

式(8.43)描述圆锥曲线。根据总能量的大小,分为三种情形:椭圆,抛物线和双曲线。

​ 对应椭圆轨道,可以得到 r1=p1+er_1=\frac{p}{1+e}r2=p1er_2=\frac{p}{1-e} ,因此椭圆轨道的长轴为

2a=r1+r2=2p1e2=αE(8.44)2a=r_1+r_2=\frac{2p}{1-e^2}=\frac{\alpha}{|E|} \tag{8.44}

即椭圆轨道长轴只和粒子的能量 EE 有关,与椭圆形状无关。椭圆轨道的半短轴为

b=a1e2=J2mE(8.45)b=a\sqrt{1-e^2}=\frac{J}{\sqrt{2m|E|}} \tag{8.45}

与能量和角动量都有关。粒子沿椭圆轨道运动一周所需的时间即周期,有角动量守恒式(8.23)得 Jdt=mr2dϕJ\mathrm dt=mr^2\mathrm d\phi ,代入轨道方程(8.43)积分得到(也可直接利用椭圆面积公式)

T=02πmr2(ϕ)Jdϕ=mJ2πab=παm2E3=2πmαa3(8.46)T=\int_{0}^{2\pi}\frac{mr^2(\phi)}{J}\mathrm d\phi=\frac {m}{J}2\pi ab=\pi \alpha\sqrt{\frac{m}{2|E|^3}}=2\pi\sqrt{\frac m\alpha a^3} \tag{8.46}

这就是开普勒第三定理(third law of Kepler),即椭圆轨道周期的平方能量绝对值的三次方成反比,或者与半长轴的三次方成正比。

8.3.2 拉普拉斯-龙格-楞次矢量

​ 中心势场的空间转动不变性和时间平移不变性分别导致了角动量 J\boldsymbol J 和总能量 EE 的守恒。开普勒问题中轨道的闭合性意味着系统具有比时空对称性更高的对称性。这种对称性导致新的运动常数,即所谓拉普拉斯-龙格-楞次矢量(Laplace-Runge-Lenz vector),简称 LRL 矢量,定义为

A=p×Jαmrr(8.47)\boldsymbol A=\boldsymbol p\times\boldsymbol J-\alpha m\frac{\boldsymbol r}{r} \tag{8.47}

利用 pmr˙\boldsymbol p\equiv m\dot{\boldsymbol r}Jr×p\boldsymbol J\equiv \boldsymbol r\times\boldsymbol p ,LRL 矢量可以展开写成

A=m2r˙2rm2(r˙r)r˙αmrr(8.47)\boldsymbol A=m^2\dot{\boldsymbol r}^2\boldsymbol r-m^2(\dot{\boldsymbol r}\cdot\boldsymbol r)\dot{\boldsymbol r}-\alpha m\frac{\boldsymbol r}{r}\tag{8.47}

由开普勒问题的运动方程(8.17)得 dpdt=mr¨=V(r)rrαr3r\frac{\mathrm d\boldsymbol p}{\mathrm dt}=m\ddot{\boldsymbol r}=-V'(r)\frac{\boldsymbol r}{r}\equiv-\frac{\alpha}{r^3}\boldsymbol r,于是

dAdt=dpdt×J+αm1r2r˙rαmr˙r=αr3r×J+αm1r2r˙rαmr˙r=αr3r×(r×p)+αm1r2r˙rαmr˙r=αr3[r(rp)r2p]+αm1r2r˙rαmr˙r=0(8.49)\begin{aligned} \frac{\mathrm d\boldsymbol A}{\mathrm dt}&=\frac{\mathrm d\boldsymbol p}{\mathrm dt}\times\boldsymbol J+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\ &=-\frac{\alpha }{r^3}\boldsymbol r\times\boldsymbol J+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\ &=-\frac{\alpha }{r^3}\boldsymbol r\times(\boldsymbol r\times\boldsymbol p)+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\ &=-\frac{\alpha }{r^3}[\boldsymbol r(\boldsymbol r\cdot \boldsymbol p)-r^2\boldsymbol p]+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}=0 \end{aligned} \tag{8.49}

其中用到了 rp=mrr˙=12md(rr)dt\boldsymbol r\cdot \boldsymbol p=m\boldsymbol r\cdot\dot{\boldsymbol r}=\frac 12m\frac{\mathrm d(\boldsymbol r\cdot\boldsymbol r)}{\mathrm dt} ,因此 LRL 矢量确实是运动常数。

​ 可以验证

AJ=0(8.50)\boldsymbol A\cdot \boldsymbol J=0 \tag{8.50}

意味着 LRL 矢量 A\boldsymbol A 和角动量矢量 J\boldsymbol J 垂直,因此 LRL 矢量即位于轨道平面上。

​ 利用 LRL 矢量,可以以非常简洁的方式得到轨道方程。既然 LRL 矢量 A\boldsymbol A 处于轨道平面上且是常矢量,不妨取其作为轨道平面极坐标的极轴方向,即有 Ar=Arcosϕ\boldsymbol A\cdot \boldsymbol r=Ar\cos\phi 。另一方面

Ar=(p×J)rαmrrr=(r×p)Jαmr=J2αmr\boldsymbol A\cdot\boldsymbol r=(\boldsymbol p\times\boldsymbol J)\cdot\boldsymbol r-\alpha\frac{m}{r}\boldsymbol r\cdot\boldsymbol r=(\boldsymbol r\times\boldsymbol p)\cdot \boldsymbol J-\alpha mr=J^2-\alpha mr

于是可以解出轨道方程

r(ϕ)=J2αm+Acosϕ(8.51)r(\phi)=\frac{J^2}{\alpha m+A\cos\phi} \tag{8.51}

其正具有式(8.43)的形式。对比式(8.51)和(8.43),得到

p=J2mα,e=Amα(8.52)p=\frac{J^2}{m\alpha},\quad e=\frac{A}{m\alpha}\tag{8.52}

同时 A=mαeA=m\alpha e 意味着

A2=m2α2+2mEJ2(8.53)A^2=m^2\alpha^2+2mEJ^2\tag{8.53}

式(8.53)表明,LRL 矢量的大小并不是独立的,而是由总能量 EE 和角动量大小 JJ 决定。

​ 由 LRL 矢量的定义式(8.47),有 αmJ×rr=J×(p×JA)=pJ2J×A\alpha m\boldsymbol J\times\frac{\boldsymbol r}{r}=\boldsymbol J\times(\boldsymbol p\times\boldsymbol J-\boldsymbol A)=\boldsymbol pJ^2-\boldsymbol J\times\boldsymbol A ,两边同求内积,得到

(pJ×AJ2)2=(αmJ)2(8.54)\left(\boldsymbol p-\frac{\boldsymbol J\times\boldsymbol A}{J^2} \right)^2=\left(\frac{\alpha m}{J}\right)^2\tag{8.54}

因为角动量守恒,式(8.54)表明 pJ×AJ2\boldsymbol p-\frac{\boldsymbol J\times\boldsymbol A}{J^2} 是一个长度固定为 αmJ\frac{\alpha m}{J} 的矢量,将其轨道平面取为 {x,y}\{x,y\}-平面,即有 J=Jez\boldsymbol J=J\boldsymbol e_zp=pxex+pyey\boldsymbol p=p_x\boldsymbol e_x+p_y\boldsymbol e_y 。令 LRL 矢量指向 xx 方向,即 A=Aex\boldsymbol A=A\boldsymbol e_x 。式(8.54)称为

px2+(pyAJ)2=(αmJ)2(8.55)p_x^2+\left(p_y-\frac{A}{J}\right)^2=\left(\frac{\alpha m}{J} \right) ^2\tag{8.55}

式(8.55)意味着在 {px,py}\{p_x,p_y\}-平面上,粒子的动量轨迹是圆心为 {px,py}={0,AJ}\{p_x,p_y\}=\left\{0,\frac{A}{J} \right\} ,半径为 αmJ\frac{\alpha m}{J} 的圆周,这正是开普勒问题具有比纯空间的转动不变性更高的对称性的反映。

8.3.3 开普勒问题的对称性

​ 开普勒问题中存在不同的轨道对应同一能量是一种不同于时空对称性的对称性的体现,这种对称性来源于势能 αr-\frac{\alpha}{r} 的特殊形式。

​ LRL 矢量所对应的直角坐标 xix^i 的无穷小变换为

δ(j)xi=ϵ[2x˙ixjxix˙j(rr˙)δij]i,j=1,2,3(8.56)\delta_{(j)}x_i=\epsilon[2\dot x_i x_j-x_i\dot x_j-(\boldsymbol r\cdot \dot{\boldsymbol r})\delta_{ij}],\quad i,j=1,2,3\tag{8.56}

这里 ϵ\epsilon 为无穷小参数, jj 为给定某分量指标(在此方向的变换)。由式(8.56)得

δ(j)x˙i=ddt(δ(j)xi)=ϵ[2x¨ixj+x˙ix˙jxix¨jr˙2δij(rr¨)δij](8.57)\delta_{(j)}\dot x_i=\frac{\mathrm d}{\mathrm dt}\left(\delta_{(j)} x_i\right)=\epsilon[2\ddot x_ix_j+\dot x_i\dot x_j-x_i\ddot x_j-\dot {\boldsymbol r}^2\delta_{ij}-(\boldsymbol r\cdot \ddot{\boldsymbol r})\delta_{ij}] \tag{8.57}

开普勒问题作用量的变换为

Δ(j)S=dt(mr˙δ(j)r˙αr2δ(j)r)(8.58)\Delta_{(j)} S=\int \mathrm dt\left(m\dot{\boldsymbol r}\cdot\delta_{(j)}\dot{\boldsymbol r}-\frac{\alpha}{r^2}\delta_{(j)} r \right)\tag{8.58}

计算可以得到

r˙δ(j)r˙=x˙iδ(j)x˙i=ϵddt[r˙2xj(r˙r)x˙j](8.59)\dot{\boldsymbol r}\cdot\delta_{(j)}\dot{\boldsymbol r}=\dot x^i\delta_{(j)}\dot x_i=\epsilon\frac{\mathrm d}{\mathrm dt}\left[\dot{\boldsymbol r}^2x_j-(\dot{\boldsymbol r}\cdot\boldsymbol r)\dot x_j \right] \tag{8.59}

1r2δ(j)r=1r3xiδ(j)xi=ϵddt(1rxj)(8.60)\frac{1}{r^2}\delta_{(j)} r=\frac{1}{r^3}x^i\delta_{(j)}x_i=-\epsilon\frac{\mathrm d}{\mathrm dt}\left(\frac 1rx_j \right)\tag{8.60}

其中用到 rr˙=ddt(rr)r˙r=12ddtr2=rr˙\boldsymbol r\cdot \dot{\boldsymbol r}=\frac{\mathrm d}{\mathrm dt}(\boldsymbol r\cdot \boldsymbol r)-\dot{\boldsymbol r}\cdot \boldsymbol r=\frac 12\frac{\mathrm d}{\mathrm dt}r^2=r\dot r

即都可以写成时间全导数的形式。代入式(8.58),即有

Δ(j)S=dtdF(j)dt,F(j)=ϵ[m(r˙2xj(rr˙)xj)+α1rxj](8.61)\Delta_{(j)} S=\int \mathrm dt \frac{\mathrm dF_{(j)}}{\mathrm dt},\quad F_{(j)}=\epsilon\left[m(\dot{\boldsymbol r}^2x_j-(\boldsymbol r\cdot \dot{\boldsymbol r})x_j)+\alpha \frac 1rx_j \right] \tag{8.61}

根据诺特定理,存在运动常数

Q(j)=1ϵ(Lx˙iδ(j)xiF(j))=mr˙2xjm(r˙r)x˙jαrxj1mAj,j=1,2,3(8.62)Q_{(j)}=\frac 1\epsilon\left(\frac{\partial L}{\partial \dot x_i}\delta_{(j)}x_i-F_(j) \right)=m\dot{\boldsymbol r}^2x_j-m(\dot{\boldsymbol r} \cdot \boldsymbol r)\dot x_j-\frac{\alpha}{r}x_j\equiv \frac{1}{m}A_j,\quad j=1,2,3 \tag{8.62}

正是 LRL 矢量。

Chapter 9 微扰展开

9.1 线性化与微扰论

​ 对于非线性的系统,我们希望将其线性化(linearization),即将物理系统在已知的解附近做近似,保留线性阶,得到一个线性系统。重复此步骤,可以一点点拓宽物理系统在解空间中的已知区域。这个过程就是微扰论(perturbation theory)。

9.2 函数的微扰展开

​ 微扰论的基本手续是微扰展开(perturbative expansion)。

​ 考虑一元函数 F(x)F(x) ,在某点 x\overline x 处取极值为 F(x)F(\overline x) 。当变量 xxx\overline x 有微小的偏离时,记

x=x+δx(9.1)x=\overline x+\delta x\tag{9.1}

则由之产生的 F(x)F(x)F(x)F(\overline x) 的偏离为

F(x+δx)F(x)=F(x)δx=0+12F(x)(δx)2+(9.2)F(\overline x+\delta x)-F(\overline x)=\underbrace{F'(\overline x)\delta x}_{=0}+\frac 12F''(\overline x)(\delta x)^2+\cdots\tag{9.2}

在微扰展开的语言中,相对其做展开的点 x\overline x 被称作背景(background),对背景的小“偏离” δx\delta x 被称为扰动(perturbation)或微扰。在式(9.2)中, FF(x)\overline F\equiv F(\overline x) 即函数的背景值(background value),只和 x\overline x 有关。式(9.2)等号右边第一项为扰动 δx\delta x线性项(linear term) F1(δx)F(x)δxF_1(\delta x)\equiv F'(\overline x)\delta x 。第二项为展开的二次项(quadratic term)F2(δx)12F(x)δxF_2(\delta x)\equiv\frac 12F''(x)\delta x ,是扰动 δx\delta x 的二次型。可以看出,二次项 F2(δx)F_2(\delta x) 是在极值点 x\overline x 附近、函数微扰展开的领头阶近似(leading order approximation)或最低阶近似(lowest orfer approximation)。

9.3 作用量的微扰展开

9.3.1 单自由度

​ 先考虑单自由度的系统,拉格朗日量为 L(t,q,q˙)L(t,q,\dot q) 。给定一组运动方程,有无穷多个解,对应无穷多种初始(边界)条件。假定已知系统运动方程的某个特解 q=q(t)\overline q=\overline q(t) ,其满足运动方程即意味着其使得作用量取极值

δSδqq=(ddtLq˙Lq)q=0(9.3)-\left . \frac{\delta S}{\delta q} \right |_{\overline q}=\left.\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q}-\frac{\partial L}{\partial q} \right) \right|_{\overline q}=0\tag{9.3}

在微扰展开中,这个已知的特解 q(t)\overline q(t) 被称为背景位形(background configuration),简称为背景。现在考虑系统对这个背景的“小偏离”,记作

q(t)=q(t)+ϵδq(t)(9.4)q(t)=\overline q(t)+\epsilon\delta q(t) \tag{9.4}

这里 δq\delta q 即表征系统位形对背景位形 q\overline q 的偏离,被称作扰动(perturbation),ϵ\epsilon 是用来表征扰动大小的小量。作用量 S[q]=S[q+ϵδq]S[q]=S[\overline q+\epsilon \delta q]ϵ\epsilon 的普通函数,做泰勒展开,得到

S[q+ϵδq]=dtL(t,q+ϵδq,q˙+ϵδq˙)=dtn=0ϵnn![(δqq+δq˙q˙)nL]qS0+ϵS1+ϵ2S2+ϵ3S3+(9.5)\begin{aligned} S[\overline q+\epsilon\delta q]&=\int \mathrm dtL(t,\overline q+\epsilon\delta q,\dot q+\epsilon \delta \dot q)=\int \mathrm dt \sum_{n=0}^\infty\frac{\epsilon^n}{n!}\left .\left[\left( \delta q\frac{\partial}{\partial q}+\delta \dot q\frac{\partial}{\partial \dot q}\right)^nL \right]\right|_{\overline q}\\ &\equiv S_0+\epsilon S_1+\epsilon^2S_2+\epsilon^3S_3+\cdots \end{aligned}\tag{9.5}

我们按照 ϵ\epsilon 的阶数,对 SnS_n 逐阶讨论。

​ 在零阶,

S0[δq]dtL(t,q,q˙)(9.6)S_0[\delta q]\equiv \int\mathrm dtL(t,\overline q,\dot {\overline q}) \tag{9.6}

就是背景本身的作用量。

​ 在一阶,

S1[δq]=dt(Lqqδq+Lq˙qδq˙)dt/(LqddtLq˙)q=0δq0(9.7)S_1[\delta q]=\int \mathrm dt\left(\left.\frac{\partial L}{\partial q}\right|_{\overline q}\delta q+\left.\frac{\partial L}{\partial \dot q}\right|_{\overline q}\delta \dot q \right)\simeq\int \mathrm dt\underbrace{\left/\left(\frac{\partial L}{\partial q}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q} \right)\right|_{\overline q}}_{=0}\delta q\equiv 0\tag{9.7}

δSδqq=0S1[δq]=0(9.8)\left.\frac{\delta S}{\delta q} \right|_{\overline q}=0\quad \Rightarrow\quad S_1[\delta q]=0\tag{9.8}

扰动的一阶项恒为零。

​ 在二阶,扰动的二阶作用量(quadratic action)为

S2[δq]=dt(12G(δq˙)2+Nδq˙δq+12M(δq)2)(9.9)S_2[\delta q]=\int\mathrm dt\left(\frac 12G(\delta \dot q)^2+N\delta \dot q\delta q+\frac 12M(\delta q)^2 \right)\tag{9.9}

上式中被积函数即扰动的二次拉格朗日量。其中

G=2Lq˙2q,N=2q˙qq,M=2Lq2q(9.10)G=\left. \frac{\partial^2 L}{\partial \dot q^2}\right|_{\overline q},\quad N=\left. \frac{\partial ^2}{\partial \dot q\partial q} \right|_{\overline q},\quad M=\left.\frac{\partial^2 L}{\partial q^2} \right|_{\overline q} \tag{9.10}

都是“背景” q\overline q 的函数。利用分部积分 Nδq˙δq12N˙(δq)2N\delta \dot q\delta q\simeq -\frac 12\dot N(\delta q)^2 ,得到

S2[δq]=dt12[G(δq˙)2W(δq)2](9.11)S_2[\delta q]=\int \mathrm dt\frac 12\left[G(\delta \dot q)^2-W(\delta q)^2 \right]\tag{9.11}

其中

W=N˙M(9.12)W=\dot N-M \tag{9.12}

Example 9.2 单摆的扰动

​ 单摆的拉格朗日作用量为 L=12ml2θ˙2+mglcosθL=\frac12 ml^2\dot \theta ^2+mgl\cos\theta 。假设已知 θ(t)\overline \theta(t),作为背景解,满足运动方程,即 θ¨+glsinθ=0\ddot \theta +\frac{g}{l}\sin\overline \theta=0 。考虑另一个可能解,与背景有小偏离,记为 θ=θ+ϵδθ\theta=\overline \theta+\epsilon \delta \theta ,这里 δθ\delta \theta 即扰动。代入拉格朗日量,得到

L=12ml2(θ˙+ϵδθ˙)2+mglcos(θ+ϵδθ)=L0+L1+L2+L=\frac 12ml^2\left(\dot{\overline \theta}+\epsilon \delta \dot\theta \right)^2+mgl\cos(\overline \theta+\epsilon\delta \theta)=L_0+L_1+L_2+\cdots

其中 L0=12ml2θ˙2+mglcosθL_0=\frac 12ml^2\dot{\overline \theta}^2+mgl\cos\overline \theta 即背景拉格朗量,L1ml2(θ¨glsinθ)δθ0L_1\simeq ml^2(\ddot{\overline \theta}-\frac{g}{l}\sin\overline \theta)\delta \theta\equiv 0 为一阶拉格朗日量。L2L_2 为二次拉格朗日量,

L2=12(ml2(δθ˙)2mglcosθ(δθ)2)L_2=\frac 12\left(ml^2\left(\delta \dot \theta\right)^2-mgl\cos\overline \theta(\delta \theta)^2 \right)

9.3.2 多自由度

​ 记广义坐标为 {qa}\{q^a\} ,扰动记为

qa(t)=qa(t)+ϵδqa(t),a=1,2,,s(9.13)q^a(t)=\overline q^a(t)+\epsilon \delta q^a(t),\quad a=1,2,\cdots,s\tag{9.13}

这里 {q(t)}\{\overline {\boldsymbol q}(t)\} 是某组已知的特解,{δq}\{\delta \boldsymbol q\} 代表扰动。与单自由度系统作用量的展开形式类似,拉格朗日量为 L(t,q,q˙)L(t,\boldsymbol q,\dot {\boldsymbol q}) ,作用量 S[q+ϵδq]S[\overline{\boldsymbol q}+\epsilon \delta \boldsymbol q] 展开得到

dtL(t,q+ϵδq,q˙+ϵδq˙)=dtn=0ϵnn![(δqaqa+δq˙aq˙a)nL]qS0[q]+ϵS1[q]=0+ϵ2S2[q]+ϵ3S3[q]+(9.14)\begin{aligned} &\int\mathrm dtL\left(t,\overline{\boldsymbol q}+\epsilon \delta\boldsymbol q,\dot{\overline{\boldsymbol q}}+\epsilon\delta \dot{\boldsymbol q} \right)=\int \mathrm dt\sum_{n=0}^{\infty}\frac{\epsilon ^n}{n!}\left.\left[\left(\delta q^a\frac{\partial }{\partial q^a}+\delta \dot q^a\frac{\partial }{\partial \dot q^a} \right)^n L\right]\right|_{\overline{\boldsymbol q}} \\ \equiv& S_0[\overline{\boldsymbol q}]+\epsilon\underbrace{ S_1[\overline{\boldsymbol q}]}_{=0}+\epsilon^2S_2[\overline{\boldsymbol q}]+\epsilon^3S_3[\overline{\boldsymbol q}]+\cdots \end{aligned}\tag{9.14}

S0[q]=dtL(t,q,q˙)S_0[\overline q]=\int \mathrm dtL(t,\overline{\boldsymbol q},\dot{\overline{\boldsymbol q}}) 是背景作用量,扰动的一阶作用量恒为零 S1[δq]=0S_1[\delta \boldsymbol q]=0

​ 在二阶,直接展开得到扰动的二次作用量为

S2[δq]=dt(12Gabδq˙aδq˙b+Nabδq˙aδqb+12Mabδqaδqb)(9.15)S_2[\delta \boldsymbol q]=\int \mathrm dt\left(\frac 12G_{ab}\delta \dot q^a\delta \dot q^b+N_{ab}\delta \dot q^a\delta q^b+\frac 12 M_{ab}\delta q^a\delta q^b \right) \tag{9.15}

这里

Gab:=2Lq˙aq˙bq,Nab:=2Lq˙aqbq,Mab=2Lqaqb(9.16)G_{ab}:=\left.\frac{\partial^2 L}{\partial \dot q^a\partial \dot q^b}\right|_{\overline{\boldsymbol q}},\quad N_{ab}:=\left.\frac{\partial^2 L}{\partial \dot q^a\partial q^b}\right|_{\overline{\boldsymbol q}},\quad M_{ab}=\frac{\partial ^2 L}{\partial q^a\partial q^b} \tag{9.16}

都是背景的函数。扰动的二次作用量可以通过分部积分约化为

S2[δq]=dt(12Gabδq˙aδq˙b+12Fabδq˙aδqb12Wabδqaδqb)(9.17)S_2[\delta \boldsymbol q]=\int \mathrm dt\left(\frac12 G_{ab}\delta \dot q^a\delta \dot q^b +\frac12 F_{ab}\delta \dot q^a\delta q^b-\frac 12W_{ab}\delta q^a\delta q^b \right) \tag{9.17}

其中

Fab=NabNba,Wab=Mab+N˙ba(9.18)F_{ab}=N_{ab}-N_{ba},\quad W_{ab}=-M_{ab}+\dot N_{ba} \tag{9.18}

Nabδq˙aδqb=12Nabδq˙aδqb+12Nbaδq˙bδqa =12(NabNba)12N˙baδqbδqa+12ddt(Nbaδqbδqa)\begin{aligned} N_{ab}\delta \dot q^a\delta q^b&=\frac 12N_{ab}\delta \dot q^a\delta q^b+\frac 12N_{ba}\delta \dot q^b\delta q^a \\\ &=\frac 12(N_{ab}-N_{ba})-\frac{1}{2}\dot N_{ba}\delta q^b\delta q^a+\frac12\frac{\mathrm d}{\mathrm dt}\left(N_{ba}\delta q^b\delta q^a \right) \end{aligned}

注意式(9.17)中,GabG_{ab} 是对称的,而 FabF_{ab} 是反对称的。用矩阵形式,式(9.17)可以写成

S2[δq]=dt(12(δq˙)TGδq˙+12(δq˙)TFabδq12(δq)TWabδq)(9.19)S_2[\delta \boldsymbol q]=\int \mathrm dt\left(\frac 12(\delta \dot{\boldsymbol q})^TG\delta \dot{\boldsymbol q}+\frac 12 (\delta \dot{\boldsymbol q})^T F_{ab}\delta \boldsymbol q -\frac 12(\delta \boldsymbol q)^TW_{ab}\delta \boldsymbol q \right) \tag{9.19}

Example 9.3 中心势场中的扰动

​ 考虑中心势场中的粒子,约化成 2 维平面上的运动,拉格朗日量为 L=12m(r˙2+r2ϕ˙2)V(r)L=\frac 12 m\left(\dot r^2+r^2\dot \phi^2\right)-V(r) 。假设已知解 r(t)\overline r(t)ϕ(t)\overline \phi(t) ,作为背景。考虑另一组可能的解,记为 r=r+ρr=\overline r+\rhoϕ=ϕ+φ\phi=\overline \phi+\varphi ,这里 ρ\rhoφ\varphi 是扰动。代入拉格朗日量,展开得到

L=12m[(r˙+ρ˙)2+(r+ρ)2(ϕ˙+φ˙)2]V(r+ρ)=L0+L1+L2+L=\frac 12m\left[\left(\dot {\overline r}+\dot \rho\right)^2 +(\overline r+\rho)^2\left(\dot{\overline \phi}+\dot \varphi \right)^2 \right]-V(\overline r+\rho)=L_0+L_1+L_2+\cdots

其中,L0=12m(r˙2+r2ϕ˙2)V(r)L_0=\frac 12m\left(\dot{\overline r}^2+\overline r^2\dot{\overline \phi}^2\right)-V(\overline r)L1L_1 为扰动的一阶拉格朗日量,做分部积分后,系数正比于背景运动方程

L1=m(r˙ρ˙+r2ϕ˙φ˙+rϕ˙2ρ)V(r)ρ(mr¨+mrϕ˙2V(r))ρmddt(r2ϕ˙)φ=0\begin{aligned} L_1&=m(\dot{\overline r}\dot \rho+\overline r^2\dot{\overline \phi}\dot \varphi+\overline r\dot{\overline \phi}^2\rho)-V'(\overline r)\rho\\ &\simeq \left(-m\ddot{\overline r}+m\overline r\dot{\overline \phi}^2 -V'(\overline r)\right)\rho-m\frac{\mathrm d}{\mathrm dt}\left(\overline r^2\dot{\overline \phi} \right)\varphi=0 \end{aligned}

L2L_2 为扰动 ρ\rhoφ\varphi 的二次拉格朗日量

L2=12mρ˙2+12(mϕ˙2V(r))ρ2+12mr2φ˙2+2mrϕ˙ρφ˙L_2=\frac 12m\dot \rho^2+\frac 12\left(m\dot{\overline \phi}^2-V''(\overline r) \right)\rho^2+\frac 12mr^2\dot \varphi^2+2m\overline r\dot{\overline \phi}\rho\dot\varphi

其中系数都是背景(已知)的函数。

​ 总之,作用量的微扰展开得到扰动的作用量,具有形式

S[q+δq]S[q]=S2[δq]自由部分(free part)+S3[δq]+S4[δq]+相互作用(interations)(9.20)S[\boldsymbol q+\delta \boldsymbol q]-S[\overline{\boldsymbol q}]=\underbrace{S_2[\delta \boldsymbol q]}_{自由部分(\text{free part})}+\underbrace{S_3[\delta\boldsymbol q]+S_4[\delta \boldsymbol q]+\cdots }_{相互作用(\text{interations})} \tag{9.20}

9.4 稳定平衡位形附近的微扰展开

平衡位形(equilibrium configuration)

qa=const,a=1,,s(9.21)\overline q^a=const,\quad a=1,\cdots,s \tag{9.21}

即系统运动方程的静态(static)解。

9.4.1 单自由度

​ 平衡条件等价于

(ddtLq˙Lq)q=2Lq˙tq+2Lq˙qqq˙+2Lq˙2qq¨=0Lqq=0Lqq=0(9.22)\left.\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q}-\frac{\partial L}{\partial q} \right)\right|_{\overline q}=\underbrace{\left.\frac{\partial ^2 L}{\partial \dot q\partial t} \right|_{\overline q}+\left.\frac{\partial^2 L}{\partial \dot q\partial q}\right|_{\overline q}\dot q+\left.\frac{\partial ^2L}{\partial \dot q^2}\right|_{\overline q}\ddot q}_{=0}-\left.\frac{\partial L}{\partial q} \right|_{\overline q}=0\quad\Rightarrow \quad \left.\frac{\partial L}{\partial q} \right|_{\overline q}=0 \tag{9.22}

对于非相对论性定常系统,拉格朗日量为 L=TV=12G(q)q˙2V(q)L=T-V=\frac 12G(q)\dot q^2-V(q) 。因此,平衡条件即

Vqq=0(9.23)\left.\frac{\partial V}{\partial q} \right|_{\overline q}=0\tag{9.23}

对应势能的极值点。

​ 通常要求扰动的背景是稳定(stable)的,即扰动不会随着时间无限增大。在领头阶,这就要求扰动的线性运动是小振动方程,这样扰动才会围绕背景作往复振动,而不会无限偏离。扰动的二次作用量由式(9.11)给出,对于平衡位形 GGWW 都是常数。小振动方程要求 W/G>0W/G>0 。对于非相对论性定常系统

G=2Lq˙2q=2Tq˙2q,W=2Lq2q=d2Vdq2q(9.24)G=\left.\frac{\partial ^2L}{\partial \dot q^2} \right|_{\overline q}=\left.\frac{\partial ^2 T}{\partial \dot q^2} \right|_{\overline q},\quad W=-\left.\frac{\partial^2 L}{\partial q^2} \right|_{\overline q}=\left.\frac{\mathrm d^2 V}{\mathrm dq^2} \right|_{\overline q} \tag{9.24}

通常动能总是正的即 G>0G>0 ,因此稳定性要求

d2Vdq2q>0(9.25)\left.\frac{\mathrm d^2V}{\mathrm dq^2}\right|_{\overline q}>0\tag{9.25}

结合式(9.23)和(9.25),若系统的势能在某位置有严格的极小值,则此位置是系统的稳定平衡位形。

Example 9.5 旋转圆环上的粒子与自发对称性破缺

​ 如图所示,质量为 mm 的粒子在半径为 RR 的光滑圆环上运动,圆环水平高度固定,在外界驱动下绕着中心轴以恒定角速度 ω\omega 转动。这是一个单自由度的非定常系统。

​ 取广义坐标为 θ\theta ,粒子的拉格朗日量为

L=12mR2(θ˙2+ω2sin2θ)+mgRcosθ12mR2θ˙2Veff(θ)L=\frac 12mR^2(\dot\theta^2+\omega^2\sin^2\theta)+mgR\cos\theta\equiv\frac 12mR^2\dot \theta^2-V_{eff}(\theta)

其中 Veff(θ)V_{eff}(\theta) 为有效势能

Veff(θ)=12mR2ω2sin2θmgRcosθV_{eff}(\theta)=-\frac 12mR^2\omega^2\sin^2\theta-mgR\cos\theta

虽然这是非定常系统,但是因为拉格朗日量具有单自由度定常系统的形式,所以式(9.23)和(9.25)的条件是适用的。粒子的平衡位形对应有效势能的极值点 Veff(θ)=mgRsinθ(Rω2cosθg)=0V'_{eff}(\theta)=-mgR\sin\theta(R\omega^2\cos\theta-g)=0 。根据角速度 ω\omegagR\sqrt{\frac{g}{R}} 的大小,有两种情况。若 ω<gR\omega<\sqrt{\frac gR} ,这时方程只有一个解 θ=0\theta=0 ,即圆环的最低点。因为 Veff=mR(Rω2cos(2θ)gcosθ),Veff(0)=mR2ω2(1gRω2)>0V''_{eff}=-mR(R\omega^2\cos(2\theta)-g\cos\theta),V''_{eff}(0)=-mR^2\omega^2(1-\frac{g}{R\omega^2})>0 ,因此 θ=0\theta=0 是稳定平衡位形。定义扰动 φ\varphiθ=0+φ\theta=0+\varphi ,则 φ\varphi 的二次拉格朗日量为

L2=12mR2φ˙212mR2ω2(gRω21)φ2L_2=\frac 12mR^2\dot\varphi^2-\frac 12mR^2\omega^2\left(\frac{g}{R\omega^2}-1 \right)\varphi^2

ωgR\omega\ge\sqrt{\frac gR} ,此时,除了 θ=0\theta=0 ,出现另两个极值点 θ±±arccos(gRω2)\theta_\pm\equiv \pm\arccos\left(\frac{g}{R\omega^2} \right) 。因为 Veff(0)=mR2ω2(1gRω2)<0V''_{eff}(0)=-mR^2\omega^2(1-\frac{g}{R\omega^2})<0 ,而 Veff(θ±)=mR2ω2(1g2R2ω4)>0V''_{eff}(\theta_\pm)=mR^2\omega^2(1-\frac{g^2}{R^2\omega^4})>0 ,所以 θ±\theta_\pm 是新的稳定平衡位形。定义扰动 φ\varphiθ=θ±+φ\theta=\theta_\pm+\varphi ,则 φ\varphi 的二次拉格朗日量为

L2=12mR2φ˙212mR2ω2(1g2R2ω4)φ2L_2=\frac 12mR^2\dot \varphi^2-\frac 12mR^2\omega^2\left(1-\frac{g^2}{R^2\omega^4}\right)\varphi^2

有效势能在不同 ω\omega 取值如图所示。随着 ω\omega 的连续变化,粒子的稳定平衡位形出现了“突变”。

​ 粒子的能量函数为 h=Lθ˙θ˙L=12mR2θ˙2+Veff(θ)h=\frac{\partial L}{\partial \dot \theta}\dot \theta-L=\frac 12mR^2\dot \theta^2+V_{eff}(\theta) 。给定圆环转动的角速度 ω\omega ,稳定平衡位形处对应粒子能量函数的最小值,于是不妨将处于稳定平衡位形的状态称作“最低能量态”或基态(ground state)。原始的拉格朗日式具有 θθ\theta\to -\theta 变换下的对称性,当 ω<gR\omega<\sqrt\frac gR 时,粒子基态 θ=0\theta=0 及扰动 φ\varphi 都”继承“了这种对称性。而当 ωgR\omega\ge \sqrt \frac gR 时,基态一分为二,且具有相同的能量,被称作简并(degenerate)。此时 θθ\theta\to-\theta 的对称性被打破,因为其将一个基态变成另一个基态。这种现象被称为自发对称性破缺(sponraneous symmetry breaking)。粒子基态的能量函数 h0h_0 作为 ω\omega 的函数为

h0(ω)={Veff(0)=mgR,ω<gRVeff(0)=12mR2ω2(1+g2R2ω4),ωgRh_0(\omega)= \begin{cases} V_{eff}(0)=-mgR,&\omega<\sqrt \frac gR\\ V_{eff}(0)=-\frac 12 mR^2\omega^2\left(1+\frac{g^2}{R^2\omega^4} \right),&\omega\ge\sqrt\frac gR \end{cases}

​ 这一现象可以和统计物理中的二级相变(second order phase transition)类比,角速度 ω\omega 在这里扮演了温度的角色。

9.4.2 多自由度

​ 对应非相对论性定常系统,平衡条件为

Vqaq=0(9.26)\left.\frac{\partial V}{\partial q^a}\right|_{\overline {\boldsymbol q}}=0 \tag{9.26}

此时位形 {q}\{\overline{\boldsymbol q}\} 即平衡位形。对于平衡位形,由式(9.17)知,扰动的二次拉格朗日称为

L2=12Gabδq˙aδq˙b12Wabδqaδqb(9.27)L_2=\frac 12G_{ab}\delta \dot q^a\delta\dot q^b-\frac 12 W_{ab}\delta q^a\delta q^b \tag{9.27}

其中

Gab=2Tq˙aq˙bq,Wab=2VqaqbqG_{ab}=\left.\frac{\partial ^2T}{\partial \dot q^a\partial \dot q^b}\right|_{\overline{\boldsymbol q}},\quad W_{ab}=\left.\frac{\partial ^2V}{\partial q^a\partial q^b} \right|_{\overline{\boldsymbol q}}

都是常矩阵。总要求动能是正的,即 T=12Gabδq˙aδq˙b>0T=\frac 12G_{ab}\delta \dot q^a\delta \dot q^b>0 ,这就要求矩阵 GabG_{ab} 必须是正定(positive definite)的。这时,稳定性要求 WabW_{ab} (即势能 VV 的黑塞矩阵(Hessian matrid))也是正定的。

Chapter 10 小振动

​ 如果背景是稳定的,则扰动不会随着时间无限增大。此时系统的位形始终围绕着背景做往复的运动,这种运动形式即小振动(small oscillation)。

10.1 自由振动

10.1.1 单自由度

​ 考虑单自由度保守系统在稳定平衡位形附近的微扰展开。扰动的二次作用量为

S2[q]=dt(12Gq˙212Wq2)(10.1)S_2[q]=\int\mathrm dt\left(\frac 12G\dot q^2-\frac 12 Wq^2 \right)\tag{10.1}

在本章中,因为讨论的都是扰动,简洁起见略去 " δ\delta “ 符号,记扰动为 qqqaq^a。对 S2[q]S_2[q] 变分得到线性运动方程

Gq¨+Wq=0q¨+ω2q=0(10.2)G\ddot q+Wq=0\quad \Rightarrow \quad \ddot q+\omega^2q=0 \tag{10.2}

方程(10.2)描述角频率为 ω=WG\omega=\sqrt\frac{W}{G}谐振动(harmonic oscillation)。谐振动式物理系统在稳定平衡位形附近运动的普遍形式。

​ 方程(10.2)有两个线性无关的特解,可取为

{sin(ωt),cos(ωt)}or{eiωt,e+iωt}(10.3)\{\sin(\omega t),\cos(\omega t) \}\quad \text{or}\quad \{e^{-\mathrm i \omega t},e^{+\mathrm i\omega t}\} \tag{10.3}

其中 ω\omega 即振动的角频率。通解的一般形式为

q(t)=Aeiωt+Ae+iωtAeiωt+c.c.(10.4)q(t)=Ae^{-\mathrm i\omega t}+A^*e^{+\mathrm i\omega t}\equiv Ae^{-\mathrm i\omega t }+\mathrm {c.c.} \tag{10.4}

其中 AA 是常数,c.c.\mathrm{c.c.} 表示复共轭。对于振动方程,物理上经常取两个线性无光的特解为

{u(t),u(t)}(10.6)\{u(t),u^*(t) \} \tag{10.6}

这里 u(t)u(t) 是复函数,被称为模式函数(mode function)。方程的通解为两者的线性组合

q(t)=Au(t)+Au(t)Au(t)+c.c.(10.7)q(t)=Au(t)+A^*u^*(t)\equiv Au(t)+\mathrm{c.c.}\tag{10.7}

其中 AA 是复常数。

10.1.2 简正模式

​ 单自由度谐振动的讨论向一般多自由度系统的推广是直接的。出发点为扰动的二次拉格朗日量式

L2=12Gabq˙aq˙b12Wabqaqb(10.8)L_2=\frac 12G_{ab}\dot q^a\dot q^b-\frac 12W_{ab}q^aq^b \tag{10.8}

运动方程为

Gabq¨b+Wabqb=0,a=1,,s(10.9)G_{ab}\ddot q^b+W_{ab}q^b=0,\quad a=1,\cdots,s \tag{10.9}

将扰动记为矩阵

q(qaqs)(10.10)\boldsymbol q\equiv \begin{pmatrix} q^a\\ \vdots\\ q^s \end{pmatrix}\tag{10.10}

则式(10.8)用矩阵形式写成

L2=12q˙TGq˙12qTWq(10.11)L_2=\frac 12 \dot{\boldsymbol q}^T \boldsymbol G\dot{\boldsymbol q}-\frac 12\boldsymbol q^T\boldsymbol W\boldsymbol q\tag{10.11}

其中 G\boldsymbol GW\boldsymbol W 都是常对称矩阵,且我们假设都是非退化且正定的。运动方程(10.10)的矩阵形式为

Gq¨+Wq=0(10.12)\boldsymbol G\ddot{\boldsymbol q}+\boldsymbol W\boldsymbol q=0\tag{10.12}

​ 我们猜测其也具有谐振子形式的解

q(t)=Aeiωt+Ae+iωt=Aeiωt+c.c.(10.13)\boldsymbol q(t)=\boldsymbol Ae^{-\mathrm i\omega t}+\boldsymbol A^*e^{+\mathrm i\omega t}=\boldsymbol Ae^{-\mathrm i\omega t}+\mathrm{c.c.}\tag{10.13}

这里

A=(A1As)(10.14)\boldsymbol A=\begin{pmatrix} A^1\\ \vdots\\ A^s \end{pmatrix}\tag{10.14}

是常矢量,矩阵元可以是复数。

​ 将式(10.13)代入运动方程(10.12)中,利用

q¨=ω2Aeiωt+c.c.=ω2q(10.15)\ddot{\boldsymbol q}=-\omega^2\boldsymbol Ae^{-\mathrm i\omega t}+\mathrm{c.c.}=-\omega^2\boldsymbol q \tag{10.15}

得到

Gq¨+Wq=(Wω2G)Aeiωt+c.c.=0(10.16)\boldsymbol G\ddot{\boldsymbol q}+\boldsymbol W\boldsymbol q=(\boldsymbol W-\omega^2\boldsymbol G)\boldsymbol Ae^{-\mathrm i\omega t}+\mathrm{c.c.}=0\tag{10.16}

即必须有

(Wω2G)A=0(10.17)(\boldsymbol W-\omega^2\boldsymbol G)\boldsymbol A=0\tag{10.17}

式(10.17)是矩阵 Wω2G\boldsymbol W-\omega^2\boldsymbol G 的本征方程,且表明 A\boldsymbol A 是矩阵 Wω2G\boldsymbol W-\omega^2G零本征矢(null eigenvector)。因为我们需要寻找 A0\boldsymbol A\neq0 的非平庸解,因此式(10.17)成立的充分必要条件是,矩阵 Wω2G\boldsymbol W-\omega^2G 退化。这意味着行列式为零

det(Wω2G)=0(10.18)\det(\boldsymbol W-\omega^2\boldsymbol G)=0\tag{10.18}

式(10.18)被称为自由度 ss 的小振动系统的特征方程(characteristic equation)。

​ 矩阵 Wω2G=0\boldsymbol W-\omega^2\boldsymbol G=0s×ss\times s 的方阵,因此特征方程(10.18)是 ω2\omega^2ss 次代数方程。因为背景是稳定平衡的,即要求 W\boldsymbol WG\boldsymbol G 都是正定的,因此 ω2\omega^2 的解都是正实数,即式(10.18)总存在 ω2\omega^2ss 个正实根 ω12,ω22,,ωs2\omega_1^2,\omega_2^2,\cdots,\omega_s^2 。对应 ss 个振动频率

ωα,α=1,,s(10.19)\omega_\alpha,\quad \alpha=1,\cdots,s\tag{10.19}

被称为小振动系统的特征频率(characteristic frequencies)。

​ 现在假定我们已经求解了特征方程(10.18),即找到了 ss 个振动频率式(10.19)。其中每一个给定频率 ωα\omega_\alpha 都具有式(10.13)形式的试解,即

qα(t)=Aαeiωt+c.c.,α=1,,s(10.20)\boldsymbol q_\alpha(t)=\boldsymbol A_\alpha e^{-\mathrm i\omega t}+\mathrm{c.c.},\quad \alpha=1,\cdots,s \tag{10.20}

都是系统运动方程可能的解。但是其中的系数即矢量 Aα\boldsymbol A_\alpha 并不是任意的,因为式(10.17)表明 A\boldsymbol A 必须是 Wω2G\boldsymbol W-\omega^2\boldsymbol G 的零本征矢。具体而言,对于给定的某一特征频率,有

(Wωα2G)Aα=0,a=1,,s(10.21)(\boldsymbol W-\omega_\alpha^2\boldsymbol G)\boldsymbol A_\alpha=0,\quad a=1,\cdots,s \tag{10.21}

满足式(10.24)的 Aα\boldsymbol A_\alpha 被称作某一特征频率 ωα\omega_\alpha 对于的特征矢量(characteristic vector)。因为 G\boldsymbol G 是非退化的,将式(10.21)两边同乘以 G1\boldsymbol G^{-1} ,得到

G1WAα=ωα2Aα(10.22)\boldsymbol G^{-1}\boldsymbol W\boldsymbol A_\alpha=\omega_\alpha^2 \boldsymbol A_{\alpha} \tag{10.22}

所以矩阵 G1W\boldsymbol G^{-1}\boldsymbol W 的本征值为特征频率的平方 ωα2\omega_{\alpha}^2 ,对应的本征矢正是特征矢量 Aα\boldsymbol A_{\alpha} 。这时,形如式(10.20)的解 qα\boldsymbol q_\alpha 的物理意义是,所有的自由度以同一频率 ωα\omega_\alpha 作谐振动,且系数 Aα\boldsymbol A_{\alpha} 必须满足式(10.21)。这意味着各自由度的振幅满足固定的比例关系。这组同一频率的解被称作系统的简正模式(normal mode)。需要强调的是,简正模式是对所有自由度而言的”一组“解,而不是某个自由度的解。

​ 因为运动方程是线性的,所以两个解的叠加仍然是方程的解。当简正模式选定后,系统运动方程的通解即所有简正模式的线性叠加:

q(t)=α=1sCαeiϕα系数Aαeiωαt简正模式+c.c.(10.23)\boldsymbol q(t)=\sum_{\alpha=1}^s\underbrace{C_\alpha e^{-\mathrm i\phi_{\alpha}}}_{系数}\underbrace{\boldsymbol A_{\alpha}e^{-\mathrm i\omega_\alpha t}}_{简正模式}+\mathrm{c.c.} \tag{10.23}

其中系数 CαC_{\alpha}ϕα\phi_{\alpha} 都是常实数,分别对应各个简正模式叠加的幅度和相位。总共 2s2s 个待定实常数,正好对应自由度 ss 系统作线性振动的 2s2s 个初始条件。

​ 可以总结以下多自由度系统自由振动的求解步骤:

​ (1)写出系统二次拉格朗日量中的 G\boldsymbol GW\boldsymbol W 矩阵

​ (2)根据特征方程(10.18),求特征频率 ωα\omega_{\alpha}

​ (3)对每一个特征频率,根据式(10.22)求对应的特征矢量 Aα\boldsymbol A_{\alpha} ,得到简正模式

​ (4)根据式(10.23)对所有的简正模式求和,得到通解

​ (5)根据初始条件,确定待定系数。

Example 10.1 弹簧连接的两个单摆的简正模式

​ 如图所示,两个全同的单摆由无质量的弹簧连接,摆长为 ll ,摆球质量为 mm ,单摆顶端相距为 dd ,假设弹簧的自由长度也是 dd

​ 选取摆杆与竖直方向的夹角 θ1\theta_1θ2\theta_2 为广义坐标,由直角坐标关系 x1=lsinθ1x_1=l\sin\theta_1y1=lcosθ1y_1=-l\cos\theta_1x2=d+lsinθ2x_2=d+l\sin\theta_2y2=lcosθ2y_2=-l\cos\theta_2,系统的拉格朗日量为

L=TV=12m(x˙12+y˙12)+12m(x˙22+y˙22)mgy1mgy212k((x1x2)2+(y1y2)2d)2=12ml2θ˙12+12ml2θ˙22+mglcosθ1+mglcosθ212k((dlsinθ1+lsinθ2)2+(lcosθ1lcosθ2)2d)2\begin{aligned} L=T-V=&\frac12m(\dot x_1^2+\dot y_1^2)+\frac 12m(\dot x_2^2+\dot y_2^2)-mgy_1-mgy_2 \\ &-\frac 12 k\left(\sqrt{(x_1-x_2)^2+(y_1-y_2)^2}-d\right)^2 \\ =&\frac 12ml^2\dot\theta_1^2+\frac 12ml^2\dot\theta_2^2+mgl\cos\theta_1+mgl\cos\theta_2 \\ &-\frac 12k\left(\sqrt{(d-l\sin\theta_1+l\sin\theta_2)^2+(l\cos\theta_1-l\cos\theta_2)^2} -d\right)^2 \end{aligned}

因为平衡位形 θ1=θ2=0\overline \theta_1=\overline \theta_2=0 ,即扰动为 θ1=0+ϕ1\theta_1=0+\phi_1θ2=0+ϕ2\theta_2=0+\phi_2 ,展开得到二次拉格朗日量

L2=12ml2ϕ˙12+12ml2ϕ˙2212(mgl+kl2)ϕ1212(mgl+kl2)ϕ22+kl2ϕ1ϕ2L_2=\frac12ml^2\dot\phi_1^2+\frac12ml^2\dot\phi_2^2-\frac12(mgl+kl^2)\phi_1^2-\frac 12(mgl+kl^2)\phi_2^2+kl^2\phi_1\phi_2

q=(ϕ1,ϕ2)T\boldsymbol q=(\phi_1,\phi_2)^T ,以及

G=ml2(1001),W=(mgl+kl2kl2kl2mgl+kl2)\boldsymbol G=ml^2\begin{pmatrix} 1&0\\ 0& 1 \end{pmatrix},\quad \boldsymbol W=\begin{pmatrix} mgl+kl^2&-kl^2\\ -kl^2&mgl+kl^2 \end{pmatrix}

特征方程为

0=det(Wω2G)=(mgl+kl2mω2l2kl2kl2mgl+kl2mω2l2)=ml2(gω2l)(mg+2klmωl)\begin{aligned} 0=\det(\boldsymbol W-\omega^2\boldsymbol G)=&\begin{pmatrix} mgl+kl^2-m\omega^2 l^2&-kl^2\\ -kl^2&mgl+kl^2-m\omega^2l^2 \end{pmatrix}\\ =&ml^2(g-\omega^2l)(mg+2kl-m\omega l) \end{aligned}

解的

ω12=gl,ω22=mg+2klml\omega_1^2=\frac{g}l,\quad \omega_2^2=\frac{mg+2kl}{ml}

对应的特征矢量分别为

A1=(11),A2=(11)\boldsymbol A_1=\begin{pmatrix} 1 \\ 1 \end{pmatrix},\quad \boldsymbol A_2=\begin{pmatrix} 1\\-1 \end{pmatrix}

于是通解记

(ϕ1ϕ2)=C1eiα1(11)eig/lt+C2eiα2(11)eig/l+2k/mt+c.c,\begin{pmatrix} \phi_1\\ \phi_2 \end{pmatrix}= C_1e^{-\mathrm i\alpha_1}\begin{pmatrix} 1\\1 \end{pmatrix}e^{-\mathrm i\sqrt{g/l}t}+C_2e^{-\mathrm i\alpha_2}\begin{pmatrix} 1\\-1 \end{pmatrix}e^{-\mathrm i\sqrt{g/l+2k/m}t}+\mathrm{c.c,}

其中 C1C_1C2C_2α1\alpha_1α2\alpha_2 为 4 个实常数。

10.1.3 简正坐标

​ 作用量式(10.11)中矩阵 G\boldsymbol GW\boldsymbol W 不是对角化的,所以不同的自由度出现了”耦合“,导致最终单个自由度中不同的特征频率被混合在一起。所以问题归结为,如何选取一组新的广义坐标 ζ\boldsymbol \zeta ,满足

q=Mζ(10.24)\boldsymbol q=\boldsymbol M\boldsymbol \zeta\tag{10.24}

其中 M\boldsymbol M 是常矩阵,使得用新的广义坐标 {ζ}\{\zeta\} 表达的拉格朗日量中,新的动能项系数矩阵和势能项系数矩阵同时对角化。在这样的线性变换下,二次拉格朗日量变换为

L2=12ζ˙TG~ζ˙12ζTW~ζ(10.25)L_2=\frac 12\dot {\boldsymbol \zeta}^T\tilde{\boldsymbol G}\dot{\boldsymbol \zeta}-\frac12 \boldsymbol\zeta^T\tilde{\boldsymbol W}\boldsymbol \zeta\tag{10.25}

其中

G~=MTGM,W~=MTWM(10.26)\tilde{\boldsymbol G}=\boldsymbol M^T\boldsymbol G\boldsymbol M,\quad \tilde{\boldsymbol W}=\boldsymbol M^TW\boldsymbol M \tag{10.26}

ζ\boldsymbol \zeta 的运动方程为

ζ¨+G~1W~ζ=0(10.27)\ddot{\boldsymbol \zeta}+\tilde{\boldsymbol G}^{-1}\tilde{\boldsymbol W}\boldsymbol \zeta=0\tag{10.27}

为了使新的广义坐标 ζ\boldsymbol \zeta 之间互相独立,则 G~\tilde{\boldsymbol G}W~\tilde{\boldsymbol W} 必须都称为对角矩阵。由线性代数知,对于两个正定的实对称矩阵,一定存在线性变换使得其同时对角化。因此总是存在 M\boldsymbol M ,使得变换后

G~=(g1g2g2),W~=(w1w2ws)(10.28)\tilde{\boldsymbol G}=\begin{pmatrix} g_1\\ & g_2\\ & & \ddots\\ &&&& g_2 \end{pmatrix},\quad \tilde{\boldsymbol W}=\begin{pmatrix} w_1\\ & w_2\\ &&\ddots\\ &&& w_s \end{pmatrix}\tag{10.28}

从而

G~1W~=(w1g1w2g2wsgs)(10.29)\tilde{\boldsymbol G}^{-1}\tilde{\boldsymbol W}=\begin{pmatrix} \frac {w_1} {g_1}\\ & \frac{w_2}{g_2}\\ &&\ddots\\ &&& \frac{w_s}{g_s} \end{pmatrix}\tag{10.29}

于是运动方程(10.27)成为

ζ¨α+wαgαζα=0,α=1,,s(10.30)\ddot\zeta_\alpha+\frac{w_\alpha}{g_\alpha}\zeta_\alpha=0,\quad \alpha=1,\cdots,s\tag{10.30}

显然 G~1W~\tilde{\boldsymbol G}^{-1}\tilde{\boldsymbol W}G1W{\boldsymbol G}^{-1}{\boldsymbol W} 有相同的本征值,即有

wαgα=ωα2(10.31)\frac{w_\alpha}{g_\alpha}=\omega_\alpha^2\tag{10.31}

因此式(10.27)的通解为

ζα=Cαeiϕαeiωαt+c.c.(10.32)\zeta_\alpha=C_\alpha e^{-\mathrm i\phi_\alpha}e^{-\mathrm i\omega_\alpha t}+\mathrm{c.c.}\tag{10.32}

其中 Cα,ϕαC_\alpha,\phi_\alpha 是实常数。{ζ}\{\zeta\} 被称为简正坐标(normal coordinates)。

​ 现在的问题是,如何寻找用来将 G\boldsymbol GW\boldsymbol W 同时对角化的线性变换矩阵 M\boldsymbol M ?我们可以利用此前求的的 ss 个特征矢量 {Aα}\{\boldsymbol A_\alpha\} 。因为 G\boldsymbol G 是非退化对称矩阵,于是可以用 G\boldsymbol G 作为”度规“来定义两矢量的内积

<A,B>:=ATGB(10.33)<\boldsymbol A,\boldsymbol B>:=\boldsymbol A^T\boldsymbol G\boldsymbol B \tag{10.33}

不妨称这个内积为 “G\boldsymbol G -内积” .于是总是可以选取 ss 个线性独立的特征矢量,使得其在 “G\boldsymbol G -内积” 的意义下正交归一,即满足

<Aα,Aβ>AαTGAβ=δαβ,α,β=1,,s(10.34)<\boldsymbol A_\alpha,\boldsymbol A_\beta>\equiv \boldsymbol A_\alpha^T\boldsymbol G\boldsymbol A_\beta=\delta_{\alpha\beta},\quad \alpha,\beta=1,\cdots,s\tag{10.34}

proof:

​ 对于同一特征值 ωα\omega_\alpha 的特征矢量 Aα1,,Aαk\boldsymbol A_{\alpha1},\cdots,\boldsymbol A_{\alpha k} ,显然可以通过格拉姆-施密特正交化(Gram-Schmidt orthogonalization)实现在 ”GG -内积“ 的意义下正交归一:

Aα1=Aα1Aαk=Aαki=1k1<Aαk,Aαi><Aαi,Aαi>Aαi\begin{aligned} {\boldsymbol A}'_{\alpha1}=&\boldsymbol A_{\alpha 1}\\ &\vdots\\ {\boldsymbol A'}_{\alpha k}=&\boldsymbol A_{\alpha k}-\sum_{i=1}^{k-1}\frac{<\boldsymbol A_{\alpha k},\boldsymbol A_{\alpha i}>}{<\boldsymbol A_{\alpha i},\boldsymbol A_{\alpha i}>}\boldsymbol A’_{\alpha i} \end{aligned}

再令

A~αk=1<Aαk,Aαk>Aαk\tilde{\boldsymbol A}_{\alpha k}=\frac{1}{<\boldsymbol A_{\alpha k},\boldsymbol A_{\alpha k}>}\boldsymbol A'_{\alpha k}

即可。

​ 对于不同特征值 ωα\omega_{\alpha}ωβ\omega_{\beta} 的两个特征矢量 Aα\boldsymbol A_{\alpha}Aβ\boldsymbol A_{\beta} 可以证明

<Aα,Aβ>=0<\boldsymbol A_{\alpha},\boldsymbol A_\beta>=0

考虑

G1WAα=ωαAα,G1WAβ=ωβAβ\boldsymbol G^{-1}\boldsymbol W\boldsymbol A_{\alpha}=\omega_\alpha \boldsymbol A_{\alpha},\quad \boldsymbol G^{-1}\boldsymbol W\boldsymbol A_{\beta}=\omega_\beta \boldsymbol A_{\beta}

ωα<Aβ,Aα>=AβTWAα=(AβTW)Aα=ωβ<Aβ,Aα>\omega_{\alpha}<\boldsymbol A_{\beta},\boldsymbol A_\alpha>= \boldsymbol A_\beta^{T} \boldsymbol W A_{\alpha}=(\boldsymbol A_\beta^{T} \boldsymbol W) A_{\alpha}=\omega_\beta<\boldsymbol A_\beta,\boldsymbol A_\alpha>

所以

<Aα,Aβ>=0<\boldsymbol A_\alpha,\boldsymbol A_\beta>=0

于是将这 ss 个正交归一的特征矢量每一个作为”列“,排成方阵

M=(A1A2As)=(A11A21As1A12A22As2A1sA2sAss)(10.35)\boldsymbol M=\begin{pmatrix} \boldsymbol A_1 & \boldsymbol A_2& \cdots &\boldsymbol A_s \end{pmatrix}=\begin{pmatrix} \boldsymbol A_1^1 & \boldsymbol A_2^1& \cdots &\boldsymbol A_s^1\\ \boldsymbol A_1^2 & \boldsymbol A_2^2& \cdots &\boldsymbol A_s^2\\ \vdots & \vdots& &\vdots\\ \boldsymbol A_1^s & \boldsymbol A_2^s& \cdots &\boldsymbol A_s^s\\ \end{pmatrix}\tag{10.35}

这样构成的方阵被称为模态矩阵(modal matrix),用指标来写即

Mαa=Aαa,a,α=1,,s(10.36)M^a_\alpha=A_\alpha^a,\quad a,\alpha=1,\cdots,s\tag{10.36}

其中 AαaA_\alpha^a 表示第 α\alpha 个矢量的 aa 分量。原始的广义坐标和简正坐标之间的关系为

qa=Mαaζα=Aαaζα,α=1,,s(10.37)q^a=M_\alpha^a\zeta_\alpha=A_\alpha^a\zeta_\alpha\tag{10.37},\quad \alpha=1,\cdots,s

​ 可以验证模态矩阵 M\boldsymbol M 可将 G\boldsymbol GM\boldsymbol M 同时对角化,有

G~=MTGM=(A1TA2TAsT)G(A1A2As)=(A1TGA1A1TGA2A1TGAsA2TGA1A2TGA2A2TGAsAsTGA1AsTGA2AsTGAs)=(100010001)(10.38)\begin{aligned} \tilde{\boldsymbol G}=&\boldsymbol M^T \boldsymbol G\boldsymbol M=\begin{pmatrix} \boldsymbol A_1^T\\ \boldsymbol A_2^T\\ \vdots\\ \boldsymbol A_s^T \end{pmatrix}\boldsymbol G\begin{pmatrix} \boldsymbol A_1 & \boldsymbol A_2 & \cdots &\boldsymbol A_s \end{pmatrix}\\ =&\begin{pmatrix} \boldsymbol A_1^T\boldsymbol G \boldsymbol A_1 & \boldsymbol A_1^T\boldsymbol G\boldsymbol A_2&\cdots&\boldsymbol A_1^T\boldsymbol G\boldsymbol A_s\\ \boldsymbol A_2^T\boldsymbol G\boldsymbol A_1 &\boldsymbol A_2^T\boldsymbol G\boldsymbol A_2&\cdots&\boldsymbol A_2^T\boldsymbol G\boldsymbol A_s\\ \vdots&\vdots&&\vdots\\ \boldsymbol A_s^T\boldsymbol G\boldsymbol A_1&\boldsymbol A_s^T\boldsymbol G\boldsymbol A_2&\cdots&\boldsymbol A_s^T\boldsymbol G\boldsymbol A_s \end{pmatrix}=\begin{pmatrix} 1 & 0 &\cdots & 0\\ 0 & 1 & \cdots & 0\\ \vdots &\vdots &&\vdots\\ 0&0&\cdots &1 \end{pmatrix} \end{aligned}\tag{10.38}

另一方面,有

AαT(Wωβ2G)Aβ=0(10.39)\boldsymbol A_\alpha^T(\boldsymbol W-\omega^2_\beta\boldsymbol G)\boldsymbol A_\beta=0\tag{10.39}

AαTWAβ=ωβ2δαβ(10.40)\boldsymbol A_\alpha^T\boldsymbol W\boldsymbol A_\beta=\omega^2_\beta\delta_{\alpha\beta}\tag{10.40}

于是

W~=MTWM=(A1TWA1A1TWA2A1TWAsA2TWA1A2TWA2A2TWAsAsTWA1AsTWA2AsTWAs)=(ω12000ω22000ωs2)(10.41)\begin{aligned} \tilde{\boldsymbol W}=&\boldsymbol M^T\boldsymbol W\boldsymbol M= \begin{pmatrix} \boldsymbol A_1^T\boldsymbol W \boldsymbol A_1 & \boldsymbol A_1^T\boldsymbol W\boldsymbol A_2&\cdots&\boldsymbol A_1^T\boldsymbol W\boldsymbol A_s\\ \boldsymbol A_2^T\boldsymbol W\boldsymbol A_1 &\boldsymbol A_2^T\boldsymbol W\boldsymbol A_2&\cdots&\boldsymbol A_2^T\boldsymbol W\boldsymbol A_s\\ \vdots&\vdots&&\vdots\\ \boldsymbol A_s^T\boldsymbol W\boldsymbol A_1&\boldsymbol A_s^T\boldsymbol W\boldsymbol A_2&\cdots&\boldsymbol A_s^T\boldsymbol W\boldsymbol A_s \end{pmatrix}\\ =&\begin{pmatrix} \omega_1^2 & 0&\cdots&0\\ 0 &\omega_2^2&\cdots&0\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\omega_s^2 \end{pmatrix} \end{aligned}\tag{10.41}

最后由式(10.38)有 M1=MTG\boldsymbol M^{-1}=\boldsymbol M^T\boldsymbol G ,因此式(10.24)的逆变换可以写成

ζ=M1q=MTGq(10.42)\boldsymbol\zeta=\boldsymbol M^{-1}\boldsymbol q=\boldsymbol M^T\boldsymbol G\boldsymbol q \tag{10.42}

Example 10.4 线性三原子分子的振动

​ 如图,3 个粒子由弹簧连接,其中中间粒子的质量为 MM ,两端粒子的质量为 mm 。弹簧弹劲系数设为 kk ,自由长度为 ll 。这一模型可视为对称的线性三原子分子的简化模型。

​ 考虑系统在稳定平衡位形附近的小振动,取广义坐标如图所示,系统的拉格朗日量为

L=12m(x˙12+x˙32)2+12Mx˙2212k(x1x2)212(x2x3)2L=\frac{1}{2}m(\dot x_1^2+\dot x_3^2)^2+\frac 12M\dot x_2^2-\frac12k(x_1-x_2)^2-\frac12(x_2-x_3)^2

已经自动具有二次拉格朗日量的形式。动能项和势能项系数矩阵为

G=(m000M000m),W=(kk0k2kk0kk)\boldsymbol G=\begin{pmatrix} m&0&0\\ 0&M&0\\ 0&0&m\\ \end{pmatrix},\quad \boldsymbol W=\begin{pmatrix} k&-k&0\\ -k&2k&-k\\ 0&-k&k \end{pmatrix}

特征方程为

det(Wω2G)=det(kω2mk0k2kω2Mk0kkω2m)=ω2(mω2k)(mMω2k(2m+M))=0\begin{aligned} \det(\boldsymbol W-\omega^2\boldsymbol G)=&\det\begin{pmatrix} k-\omega^2 m& -k &0\\ -k & 2k-\omega^2M & -k\\ 0 &-k & k-\omega^2m \end{pmatrix}\\ =&-\omega^2(m\omega^2-k)(mM\omega^2-k(2m+M))=0 \end{aligned}

解的 ω12=0\omega_1^2=0ω22=km\omega_2^2=\frac kmω32=k(2m+M)mM\omega_3^2=\frac{k(2m+M)}{mM} ,这里 ω1=0\omega_1=0 表示着对应的简正模式并不是振动,而是系统整体做匀速直线运动。特征矢量满足 (Wωα2G)Aα=0(\boldsymbol W-\omega_\alpha^2\boldsymbol G)\boldsymbol A_{\alpha}=0 ,得到

A1=12m+M(111),A2=12m(101),A3=12m(1+2mM)(12mM1)\boldsymbol A_1=\frac{1}{\sqrt{2m+M}}\begin{pmatrix} 1\\1\\1 \end{pmatrix},\quad \boldsymbol A_2=\frac{1}{\sqrt{2m}}\begin{pmatrix} 1\\0\\-1 \end{pmatrix},\quad \boldsymbol A_3=\frac{1}{\sqrt{2m\left(1+2\frac mM\right)}}\begin{pmatrix} 1\\-2\frac mM\\1 \end{pmatrix}

这里已经将特征向量正交归一化,即满足 AβTGAα=δαβ\boldsymbol A^T_\beta\boldsymbol G\boldsymbol A_\alpha=\delta_{\alpha\beta} ,因此模态矩阵为

M=(A1A2A3)=(12m+M12m12m(1+2mM)12m+M02mM11+2mM12m+M12m12m(1+2mM))\boldsymbol M=\begin{pmatrix} \boldsymbol A_1&\boldsymbol A_2&\boldsymbol A_3 \end{pmatrix}=\begin{pmatrix} \frac{1}{\sqrt{2m+M}}&\frac{1}{\sqrt{2m}}&\frac{1}{\sqrt{2m\left(1+2\frac mM\right)}} \\ \frac{1}{\sqrt{2m+M}}&0&-\frac{\sqrt{2m}}{M}\frac{1}{\sqrt{1+2\frac{m}{M}}} \\ \frac{1}{\sqrt{2m+M}}&-\frac 1{\sqrt{2m}}& \frac{1}{\sqrt{2m(1+2\frac mM)}}\\ \end{pmatrix}

简正坐标和原始广义坐标的关系为

ζ=(ζ1ζ2ζ3)=MTG(x1x2x3)=(m(x1+x3)+Mx22m+Mm(x1x3)2mM(x12x2+x4)2(2m+M))\boldsymbol \zeta=\begin{pmatrix} \zeta_1\\ \zeta_2\\ \zeta_3 \end{pmatrix}=\boldsymbol M^T\boldsymbol G\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} =\begin{pmatrix} \frac{m(x_1+x_3)+Mx_2}{\sqrt{2m+M}}\\ \frac{\sqrt m(x_1-x_3)}{\sqrt2}\\ \frac{\sqrt{mM}(x_1-2x_2+x_4)}{\sqrt{2(2m+M)}} \end{pmatrix}

第一个简正坐标 ζ1=2m+Mxc\zeta_1=\sqrt{2m+M}x_c ,即正比于质心坐标,因此其对应的简正模式是整体匀速直线运动。ζ2\zeta_2 对应的简正模式为中间的粒子不动,两端粒子作反向振动,频率为 ω2\omega_2ζ3\zeta_3 对应的简正模式为中间粒子与两端粒子相对作反向振动,频率为 ω3\omega_3

Chapter 13 哈密顿正则方程

13.1 哈密顿量

​ 哈密顿力学的基本量是哈密顿量。由拉格朗日量 L=L(t,q,q˙)L=L(t,\boldsymbol q,\dot{\boldsymbol q}) 出发,可以定义能量函数式

h(t,q,q˙):=Lq˙aq˙aL(13.1)h(t,\boldsymbol q,\dot{\boldsymbol q}):=\frac{\partial L}{\partial \dot q^a}\dot q^a-L \tag{13.1}

注意到 Lq˙a\frac{\partial L}{\partial \dot q^a} 其实就是广义动量

pa:=Lq˙a,a=1,,s(13.2)p_a:=\frac{\partial L}{\partial \dot q^a},\quad a=1,\cdots,s\tag{13.2}

原则上从式(13.2)可将广义速度反解为广义坐标和广义动量的函数

q˙a=q˙a(t,q,p),a=1,,s(13.3)\dot q^a=\dot q^a(t,\boldsymbol q,\boldsymbol p),\quad a=1,\cdots,s\tag{13.3}

于是定义哈密顿量(Hamiltionian)

H(t,q,p):=paq˙aL(13.4)H(t,\boldsymbol q,\boldsymbol p):=p_a\dot q^a-L\tag{13.4}

其中的广义速度需要理解为广义坐标和广义动量的函数式(13.3)

​ 哈密顿力学以相空间为出发点,相应的哈密顿量 H=H(t,q,p)H=H(t,\boldsymbol q,\boldsymbol p) 应该是相空间的函数。我们对哈密顿量做全微分

dH=d(paq˙aL)=dpaq˙a+padq˙a(Ltdt+Lqadqa+Lq˙adqa)=LtdtLqaq˙a+q˙adpa+(paLq˙a)=0dq˙a=LtdtLqaq˙a+q˙adpa(13.5)\begin{aligned} \mathrm dH&=\mathrm d(p_a\dot q^a-L)=\mathrm dp_a\dot q^a+p_a\mathrm d\dot q^a-\left(\frac{\partial L}{\partial t}\mathrm dt+\frac{\partial L}{\partial q^a}\mathrm dq^a+\frac{\partial L}{\partial \dot q^a}\mathrm dq^a \right)\\ &=-\frac{\partial L}{\partial t}\mathrm dt-\frac{\partial L}{\partial q^a}\dot q^a+\dot q^a\mathrm dp_a+\underbrace{\left(p_a-\frac{\partial L}{\partial \dot q^a} \right)}_{=0}\mathrm d\dot q^a\\ &=-\frac{\partial L}{\partial t}\mathrm dt-\frac{\partial L}{\partial q^a}\dot q^a+\dot q^a\mathrm dp_a \end{aligned}\tag{13.5}

可见哈密顿量的变化 dH\mathrm dH 只和时间参数的变化 dt\mathrm dt 、广义坐标的变化 {dqa}\{\mathrm dq^a\} 和广义动量的变化 {dpa}\{\mathrm dp_a\} 有关,而与广义速度的变化 {dq˙a}\{\mathrm d\dot q^a\} 无关。所以哈密顿量只是时间、广义坐标和广义动量的函数,与广义速度无关。

13.2 勒让德变换

13.2.1 勒让德变换的定义

​ 从速度相空间的拉格朗日量出发,通过简单的定义式(13.4),可以得到相空间中的哈密顿量 L(t,q,q˙)H(t,q,p)L(t,\boldsymbol q,\dot{\boldsymbol q})\to H(t,\boldsymbol q,\boldsymbol p)。重点在于,变换后的函数依赖关系改变了,即对广义速度的函数依赖被替换为对广义动量的函数依赖。从数学角度,这种操作手续即所谓勒让德变换(Legendre transformation)。

​ 简言之,勒让德变换就是希望换一个新的变量,用新的函数关系,来描述原来的对象。其中的新、旧变量构成共轭变量对(conjugate variable pair)。考虑 ss 个变量 {v1,,vs}\{v^1,\cdots,v^s\} 的函数 L(v)L(\boldsymbol v) ,我们希望换一组新的变量 {p1,,ps}\{p_1,\cdots,p_s\} ,这里 pap_a 定义为

paLva=pa(v),a=1,,s(13.6)p_a\equiv\frac{\partial L}{\partial v^a}=p_a(v),\quad a=1,\cdots,s\tag{13.6}

即是对应 vav^a 的共轭变量。这里 LL 除了 {v}\{\boldsymbol v\} 之外当然也可以依赖其他的变量,例如 L=L(q,v)L=L(\boldsymbol q,\boldsymbol v) ,但是我们不对 {q}\{\boldsymbol q\} 做替换,亦即 {q}\{\boldsymbol q\} 在勒让德变换中不起作用。在勒让德变换中,{v}\{\boldsymbol v\} 被称作主动变量,{q}\{\boldsymbol q\} 被称为被动变量。

​ 式(13.6)给出了 {p}\{p\} 作为 {v}\{v\} 函数的 ss 个代数方程。根据隐函数定理,式(13.6)的函数关系可逆,即可以从式(13.6)反解出全部 ss{v}\{\boldsymbol v\} 作为 {p}\{\boldsymbol p\} 的函数,从而给出 va=va(p)v^a=v^a(\boldsymbol p) 的充要条件为矩阵

pavb2Lvavb(13.7)\frac{\partial p_a}{\partial v^b}\equiv\frac{\partial^2 L}{\partial v^a\partial v^b}\tag{13.7}

非退化,这里的 2Lvavb\frac{\partial^2 L}{\partial v^a\partial v^b} 被称为 LL黑塞矩阵(Hessian matrix)。根据黑塞矩阵退化与否,可以分为两种情况。若黑塞矩阵非退化,即 det(2Lvavb)0\det\left(\frac{\partial ^2 L}{\partial v^a\partial v^b}\right)\neq 0 。在于的函数 LL 被称为正规(regular)或非奇异(non-singular)的。对于正规的 LL 函数,式(13.6)的函数关系可逆,于是原则上可以从式(13.6)反解出所有的 {v}\{\boldsymbol v\} 。若黑塞矩阵退化,即 det(2Lvavb)=0\det\left(\frac{\partial ^2L}{\partial v^a\partial v^b}\right)=0 ,这样的函数 LL 被称为非正规(irregular)或奇异(singular)的。对于奇异的 LL 函数,式(13.6)的函数关系不可逆,于是无法从式(13.6)反解出所有的 {v}\{\boldsymbol v\} ,而只能解出一部分。具体而言,如果黑塞矩阵的秩为 rr ,则总是可以解出 ss{v}\{\boldsymbol v\} 中的 rr

va=va(p;vr+1,,vs)a=1,,r(13.8)v^a=v^a(\boldsymbol p;v^{r+1},\cdots,v^s),\quad a=1,\cdots,r\tag{13.8}

剩余的 srs-r{vr+1,,vs}\{v^{r+1},\cdots,v^s\} 则无法解出。

​ 函数 L=L(v)L= L(\boldsymbol v) 的勒让德变换定义为

HpavaL(v)(13.9)H\equiv p_av^a-L(\boldsymbol v) \tag{13.9}

由式(13.6)知,新变量 {p}\{\boldsymbol p\} 是旧变量 {v}\{\boldsymbol v\} 的函数,于是变换后的新函数 HH 也可以被视为旧变量 {v}\{\boldsymbol v\} 的函数。但是,勒让德变换的巧妙之处在于——即使 HH 被视为 {v}\{\boldsymbol v\} 的函数,旧变量 {v}\{\boldsymbol v\} 进入 HH 的方式也是非常特殊的。形象点说,旧变量 {v}\{\boldsymbol v\} 总是通过新变量 {pv)}\{\boldsymbol p(\boldsymbol v)\} 这样的特殊组合“打包”进入 HH 的,即 H=H(p(v))H=H(\boldsymbol p(\boldsymbol v)) 。这一点可以直接验证

dH=d(pavaL(v))=dpava+padvaLvadva=vadpa+(paLva)=0dva=vadpa(13.10)\begin{aligned} \mathrm dH&=\mathrm d\left(p_av^a-L(\boldsymbol v)\right)=\mathrm dp_av^a+p_a\mathrm dv^a-\frac{\partial L}{\partial v^a}\mathrm dv^a\\ &=v^a\mathrm dp_a+\underbrace{\left(p_a-\frac{\partial L}{\partial v^a} \right)}_{=0}\mathrm dv^a=v^a\mathrm dp_a \end{aligned}\tag{13.10}

于是,HH 的变化只和新变量 {p}\{\boldsymbol p\} 的变化有关,所以 HH 只是新变量 {p}\{\boldsymbol p\} 的函数。需要强调的是,整个推导过程我们只用到了 pap_a 的定义式(13.6),而并没有涉及 LL 是否正规,或者是勒让德变换是否可逆。换句话说,无论 LL 是否正规,勒让德变换得到的新函数 HH 都只是新变量 {p}\{\boldsymbol p\} 的函数。

​ 既然 HH 只是 {p}\{\boldsymbol p\} 的函数,必然有

dH(p)=H(p)padpa(13.11)\mathrm dH(\boldsymbol p)=\frac{\partial H(\boldsymbol p)}{\partial p_a}\mathrm dp_a \tag{13.11}

对比式(13.10),得到

(vaH(p)pa)dpa=0(13.12)\left(v^a-\frac{\partial H(\boldsymbol p)}{\partial p_a} \right)\mathrm dp_a=0\tag{13.12}

接下需要区分两种情况。对于正规的 LL 函数,勒让德变换可逆,因此 ss{p}\{\boldsymbol p\} 是相互独立的,从式(13.12)可以得到 ss 个方程

va=H(p)pava(p),a=1,,s(13.13)v^a=\frac{\partial H(\boldsymbol p)}{\partial p_a}\equiv v^a(\boldsymbol p),\quad a=1,\cdots,s\tag{13.13}

从而可以完全解出 ss{v}\{\boldsymbol v\} ,这也正是式(13.6)的反函数关系。对于奇异的 LL 函数,勒让德变换式(13.9)不可逆,这意味着 ss{p}\{\boldsymbol p\} 并不是完全独立的,所以无法由式(13.12)得到 ss 个独立方程,从而解出全部 ss{v}\{\boldsymbol v\} 。新变量 {p}\{\boldsymbol p\} 并不完全独立意味着它们(亦即被动变量)之间存在约束。严格来说,式(13.9)定义的勒让德变换只对正规系统才成立,而对于奇异系统,式(13.9)的定义需要拓展。

Example 13.1 正规系统的勒让德变换

​ 考虑两个变量 {v1,v2}\{v^1,v^2\} 的函数 L=12m1(v1)2+12m2(v2)2L=\frac 12m_1(v^1)^2+\frac 12m_2(v^2)^2 。因此 LL 的黑塞矩阵非退化

det(2Lvavb)=det(2Lv1v12Lv1v22Lv2v12Lv2v2)=det(m100m2)=m1m20\det\left(\frac{\partial ^2L}{\partial v^a\partial v^b}\right)=\det\begin{pmatrix} \frac{\partial ^2L}{\partial v^1\partial v^1} &\frac{\partial ^2L}{\partial v^1\partial v^2}\\ \frac{\partial ^2L}{\partial v^2\partial v^1}&\frac{\partial ^2L}{\partial v^2\partial v^2} \end{pmatrix}=\det\begin{pmatrix} m_1 &0\\ 0 & m_2 \end{pmatrix}=m_1m_2\neq0

因此这是个正规系统。定义新变量为

p1Lv1=m1v1,p2Lv2=m2v2p_1\equiv \frac{\partial L}{\partial v^1}=m_1v^1,\quad p_2\equiv \frac{\partial L}{\partial v^2}=m_2v^2

LL 的勒让德变换为

H=p1v1+p2v212m1(v1)212m2(v2)2=p122m1+p222m2H=p_1v^1+p_2v^2-\frac 12m_1(v^1)^2-\frac 12m_2(v^2)^2=\frac{p_1^2}{2m_1}+\frac{p_2^2}{2m_2}

13.2.2 勒让德变换的几何意义
	给一条曲线,通常的描述方式是建立坐标系,按照“横轴-纵轴”的方式给出曲线方程。如图所示,横轴为 $v$ ,纵轴为 $L$ ,给出横轴-纵轴亦即 $v-L$ 之间的函数关系,即给出了曲线方程 $L=L(v)$

​ 而勒让德变换则是换一种思路描述同一条曲线。如图所示,曲线 L=L(v)L=L(v)v=vv=v_* 处切线斜率为

dL(v)dvv=L(v)p(v)(13.14)\left.\frac{\mathrm dL(v)}{\mathrm dv}\right|_{v_*}=L'(v_*)\equiv p(v_*)\tag{13.14}

假设函数 L(v)L(v) 是严格凸(convex)的,则 p(v)p(v_*) 是单调增加的。于是,斜率 ppvv_* 之间纯在一一对应的映射,由式(13.14)给出。亦即,给的斜率 pp 的值,就能定出曲线上一点 {v,L}={v,L(v)}\{v,L\}=\{v_*,L(v_*)\} ,这里 v=v(p)v_*=v_*(p) 由式(13.14)反解得到。而曲线通过这一点的切线方程为 LL(v)=p(v)(vv)L-L(v_*)=p(v_*)(v-v_*),整理得到

p(v)vL(v)=H=p(v)vL(13.15)\underbrace{p(v_*)v_*-L(v_*)}_{=H}=p(v_*)v-L \tag{13.15}

式(13.15)的左边式斜率 pp 的函数

H(p)=pv(p)L(v(p))(13.16)H(p)=pv_*(p)-L(v_*(p))\tag{13.16}

正是 L(v)L(v) 的勒让德变换。切线在竖轴上的截距不是别的,正是 L(v=0)=H(p)L(v=0)=-H(p) 。可见,勒让德变换不再是“横轴-纵轴”式的描述,而是“切线-截距”式的描述。完整的曲线可以被视为所有切线的包络。

13.3 相空间中的运动方程

13.3.1 正则

​ 何谓正则,在物理学的概念中一般是强调其标准型和唯一性,这一概念背后有着深刻的模式分解(mode decomposition)的思想。

13.3.2 从拉格朗日方程到哈密顿正则方程

​ 从现在开始,我们只考虑正规系统,即拉格朗日量 LL 对广义速度的黑塞矩阵非退化 det(2Lq˙aq˙b)0\det\left(\frac{\partial^2 L}{\partial \dot q^a\dot q^b} \right)\neq 0 ,系统不存在约束。哈密顿量只是广义坐标和广义动量的函数,有

dH=Htdt+Hqadqa+Hpadpa(13.17)\mathrm dH=\frac{\partial H}{\partial t}\mathrm dt+\frac{\partial H}{\partial q^a}\mathrm dq^a+\frac{\partial H}{\partial p_a}\mathrm d p_a\tag{13.17}

另一方面,利用拉格朗日方程 (p˙aLqa=0)\left(\dot p_a-\frac{\partial L}{\partial q^a}=0\right) ,得到

dH=LtdtLqa=0dqa+q˙adpa=Ltdtp˙adqa+q˙adpa(13.18)\mathrm dH=-\frac{\partial L}{\partial t}\mathrm dt-\underbrace{\frac{\partial L}{\partial q^a}}_{=0}\mathrm dq^a+\dot q^a\mathrm dp_a=-\frac{\partial L}{\partial t}\mathrm dt-\dot p_a\mathrm dq^a+\dot q^a\mathrm dp_a\tag{13.18}

对比式(13.17)和(13.18)有

q˙a=Hpa,p˙a=Hqa,a=1,,s(13.19)\dot q^a=\frac{\partial H}{\partial p_a},\quad \dot p_a=-\frac{\partial H}{\partial q^a},\quad a=1,\cdots,s\tag{13.19}

式(13.19)即哈密顿正则方程(Hamilton’s canonical equations)。式(13.17)是勒让德变换的数学结果,而式(13.18)则用到了拉格朗日方程。哈密顿正则方程和拉格朗日方程完全等价。拉格朗日方程是关于广义坐标 {q}\{\boldsymbol q\}ss 个二阶常微分方程,而哈密顿正则方程则是关于广义坐标和广义动量 {q,p}\{\boldsymbol q,\boldsymbol p\}2s2s 个一阶常微分方程。

​ 当运动方程满足时,哈密顿量对时间的全导数满足 dHdt=Lt\frac{\mathrm dH}{\mathrm dt}=-\frac{\partial L}{\partial t} ,由是(13.18)知,哈密顿量对时间的偏导数满足 Ht=Lt\frac{\partial H}{\partial t}=-\frac{\partial L}{\partial t} ,总之即有

dHdt=Ht=Lt(13.20)\frac{\mathrm dH}{\mathrm dt}=\frac{\partial H}{\partial t}=-\frac{\partial L}{\partial t}\tag{13.20}

哈密顿量对时间的全导数等于其对时间的偏导数,也可以直接利用哈密顿正则方程验证

dHdt=Ht+Hqaq˙a+Hpap˙a=Ht+HqaHpaHpaHqa=Ht(13.21)\frac{\mathrm d H}{\mathrm d t}=\frac{\partial H}{\partial t}+\frac{\partial H}{\partial q^a}\dot q^a+\frac{\partial H}{\partial p_a}\dot p_a=\frac{\partial H}{\partial t}+\frac{\partial H}{\partial q^a}\frac{\partial H}{\partial p_a}-\frac{\partial H}{\partial p_a}\frac{\partial H}{\partial q^a}=\frac{\partial H}{\partial t}\tag{13.21}

“全导数”衡量的的物理量真实的时间演化,而“偏导数”只是反映时间参数 tt 改变(例如平移)引起的物理量形式上的变化。因此,式(13.20)意味着若系统不显含时间,即不依赖于时间平移,则哈密顿量是运动常数。

Example 13.4 一维谐振子的哈密顿正则方程

​ 一维谐振子的拉格朗日量为 L=12mq˙212mω2q2L=\frac{1}{2}m\dot q^2-\frac12m\omega^2q^2,广义动量为 p=Lq˙=mq˙p=\frac{\partial L}{\partial \dot q}=m\dot q ,解的 q˙=pm\dot q=\frac pm 。于是

H(p,q)=pq˙L=ppm12mp2m2+12mω2q2=p22m+12mω2q2H(p,q)=p\dot q-L=p\frac pm-\frac 12 m\frac{p^2}{m^2}+\frac 12m\omega^2q^2=\frac{p^2}{2m}+\frac{1}2m\omega^2q^2

哈密顿正则方程为

q˙=Hp=pm,p˙=Hq=mω2q\dot q=\frac{\partial H}{\partial p}=\frac{p}{m},\quad \dot p=-\frac{\partial H}{\partial q}=-m\omega^2q

Example 13.5 闵氏空间中自由粒子的哈密顿正则方程

​ 闵氏空间中自由粒子的拉格朗日量为 L=mc21v2c2L=-mc^2\sqrt{1-\frac{\boldsymbol v^2}{c^2}} ,广义动量为 pi=mvi1v2c2p_i=\frac{mv_i}{\sqrt{1-\frac{\boldsymbol v^2}{c^2}}} 。于是

H=piviL=mv21v2c2+mc21v2c2H=p_iv^i-L=\frac{m\boldsymbol v^2}{\sqrt{1-\frac{\boldsymbol v^2}{c^2}}}+mc^2\sqrt{1-\frac{\boldsymbol v^2}{c^2}}

p2=δijpipj=m2v21v2c2\boldsymbol p^2=\delta^{ij}p_ip_j=\frac{m^2\boldsymbol v^2}{1-\frac{\boldsymbol v^2}{c^2}} ,解的 v2=c2p2m2c2+p2\boldsymbol v^2=\frac{c^2\boldsymbol p^2}{m^2c^2+\boldsymbol p^2} ,代入哈密顿量中

H(x,p)=c4m2+c2p2EH(\boldsymbol x,\boldsymbol p)=\sqrt{c^4m^2+c^2\boldsymbol p^2}\equiv E

闵氏空间自由粒子中的哈密顿正则方程为

x˙i=Hpi=c2pic2m2+c2p2,p˙i=Hxi=0,i=1,2,3\dot x^i=\frac{\partial H}{\partial p_i}=\frac{c^2 p^i}{\sqrt{c^2m^2+c^2\boldsymbol p^2}},\quad \dot p_i=-\frac{\partial H}{\partial x^i}=0,\quad i=1,2,3

第一个方程意味着粒子在做匀速直线运动,第二个方程意味着动量守恒。

Example 13.6 中心势场中非相对论性粒子的哈密顿正则方程

​ 非相对论性粒子在中心势场中的拉格朗日量为 L=12m(r˙2+r2θ˙2+r2sin2θϕ˙2)V(r)L=\frac 12m(\dot r^2+r^2\dot \theta^2+r^2\sin^2\theta \dot \phi^2)-V(r) ,广义动量为

prLr˙=mr˙r˙=prmpθLθ˙=mr2θ˙θ˙=pθmr2pϕLϕ=mr2sin2θϕ˙ϕ˙=pϕmr2sin2θ\begin{aligned} &p_r\equiv\frac{\partial L}{\partial \dot r}=m\dot r\quad \Rightarrow \quad \dot r=\frac{p_r}{m} \\ &p_\theta\equiv\frac{\partial L}{\partial \dot \theta}=mr^2\dot \theta\quad \Rightarrow \quad \dot \theta=\frac{p_\theta}{mr^2} \\ &p_\phi\equiv\frac{\partial L}{\partial \phi}=mr^2\sin^2\theta\dot \phi\quad \Rightarrow\quad \dot \phi=\frac{p_\phi}{mr^2\sin^2\theta} \end{aligned}

于是哈密顿量为

H=prr˙+pθθ˙+pϕϕ˙L=prprm+pθpθmr2+pϕpϕmr2sin2θ12m[(prm)2+r2(pθmr2)2+r2sin2θ(pϕmr2sin2θ)2]+V(r)=pr22m+pθ22mr2+pϕ22mr2sin2θ+V(r)\begin{aligned} H=&p_r\dot r+p_\theta\dot \theta+p_\phi\dot \phi-L\\ =&p_r\frac{p_r}{m}+p_\theta\frac{p_\theta}{mr^2}+p_\phi\frac{p_\phi}{mr^2\sin^2\theta}\\ &-\frac 12m\left[\left(\frac{p_r}{m} \right)^2+r^2\left(\frac{p_\theta}{mr^2} \right)^2+r^2\sin^2\theta\left(\frac{p_\phi}{mr^2\sin^2\theta} \right)^2 \right]+V(r)\\ =& \frac{p_r^2}{2m}+\frac{p_\theta^2}{2mr^2}+\frac{p_\phi^2}{2mr^2\sin^2\theta}+V(r) \end{aligned}

哈密顿正则方程为

r˙=Hpr=prm,θ˙=Lpθ=pθmr2,ϕ˙=Hpϕ=pϕmr2sin2θ\dot r=\frac{\partial H}{\partial p_r}=\frac{p_r}{m},\quad \dot \theta=\frac{\partial L}{\partial p_\theta}=\frac{p_\theta}{mr^2},\quad \dot\phi=\frac{\partial H}{\partial p_\phi}=\frac{p_\phi}{mr^2\sin^2\theta}

以及

p˙r=Hr=pθ2mr3+pϕ2mr3sin2θdV(r)dtp˙θ=Hθ=pϕ2cosθmr2sin3θ,p˙ϕ=Hϕ=0\begin{aligned} &\dot p_r=-\frac{\partial H}{\partial r}=\frac{p_\theta^2}{mr^3}+\frac{p_\phi^2}{mr^3\sin^2\theta}-\frac{\mathrm dV(r)}{\mathrm dt}\\ &\dot p_\theta=-\frac{\partial H}{\partial \theta}=\frac{p_\phi^2\cos\theta}{mr^2\sin^3\theta},\quad \dot p_\phi=-\frac{\partial H}{\partial \phi}=0 \end{aligned}

​ 在位形空间中,并不是所有关于广义坐标的微分方程都是拉格朗日方程,即存在对应的拉格朗日量。同样,在相空间中,并不是所有关于广义坐标和广义动量的方程

q˙a=ua(t,q,p),p˙a=va(t,q,p)(13.22)\dot q^a=u^a(t,\boldsymbol q,\boldsymbol p),\quad \dot p_a=v_a(t,\boldsymbol q,\boldsymbol p)\tag{13.22}

都是哈密顿正则方程,即存在对应的哈密顿量。由式(13.19)可知,若方程(13.22)为哈密顿正则方程,则有

q˙aqbuaqb=2Hqbpa,q˙apbuapb=2Hpapbp˙aqbvaqb=2Hqaqb,p˙apbvapb=2Hqapb\begin{aligned} &\frac{\partial \dot q^a}{\partial q^b}\equiv\frac{\partial u^a}{\partial q^b}=\frac{\partial ^2H}{\partial q^b\partial p_a},\quad \frac{\partial \dot q^a}{\partial p_b}\equiv\frac{\partial u^a}{\partial p_b}=\frac{\partial ^2H}{\partial p_a\partial p_b}\\ &\frac{\partial \dot p_a}{\partial q^b}\equiv\frac{\partial v_a}{\partial q^b}=-\frac{\partial ^2H}{\partial q^a\partial q^b},\quad \frac{\partial \dot p_a}{\partial p_b}\equiv\frac{\partial v_a}{\partial p_b}=-\frac{\partial ^2H}{\partial q^a\partial p_b} \end{aligned}

因此函数 ua(t,q,p)u^a(t,\boldsymbol q,\boldsymbol p)va(t,q,p)v_a(t,\boldsymbol q,\boldsymbol p) 需要满足条件

uaqb=vbpa,uapb=ubpa,vaqb=vbqa,a,b=1,,s(13.23)\frac{\partial u^a}{\partial q^b}=-\frac{\partial v_b}{\partial p_a},\quad \frac{\partial u^a}{\partial p_b}=\frac{\partial u^b}{\partial p_a},\quad \frac{\partial v_a}{\partial q^b}=\frac{\partial v_b}{\partial q^a},\quad a,b=1,\cdots,s\tag{13.23}

满足式(13.23)的条件的运动方程(13.22)具有哈密顿正则方程的形式,存在对应的哈密顿量,此时系统也被称为哈密顿系统(Hamiltonian system)。反过来,无论是由勒让德变换得到还是直接给定,只要知道系统的哈密顿量,其运动方程即由哈密顿正则方程(13.19)给出。

13.4 相空间的变分原理

​ 根据勒让德变换关系,拉格朗日量可以反过来用哈密顿量表示为

L(t,q,p,q˙,p˙):=paq˙aH(t,q,p)(13.24)L(t,\boldsymbol q,\boldsymbol p,\dot{\boldsymbol q},\dot{\boldsymbol p}):=p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)\tag{13.24}

式(13.24)中的 L(t,q,p,q˙,p˙)L(t,\boldsymbol q,\boldsymbol p,\dot{\boldsymbol q},\dot{\boldsymbol p}) 是广义坐标、广义动量及其时间导数的函数,可以视为相空间拉格朗日量(phase space Lagrangian)。特别是 q˙\dot{\boldsymbol q} 需要理解为广义坐标 q\boldsymbol q 的时间导数,因为相空间并没有广义速度的概念。位形空间的最小作用量原理要求在满足

δqa(t1)=δqa(t2)=0,a=1,,s(13.25)\delta q^a(t_1)=\delta q^a(t_2)=0,\quad a=1,\cdots,s\tag{13.25}

的边界条件时,对任意的广义坐标的变分都有 δS[q]=0\delta S[\boldsymbol q]=0 。相应的,在相空间中,把作用量视为 {q(t),p(t)}\{\boldsymbol q(t),\boldsymbol p(t) \} 共同的泛函,要求对任意广义坐标和广义动量的变分为零。

δS[q,p]t1t2dtδ[paq˙aH(t,q,p)]\delta S[\boldsymbol q,\boldsymbol p]\equiv\int_{t_1}^{t_2}\mathrm dt\delta[p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)]

这也称为相空间变分原理(vartiational principle in phase space)。展开得到

δS[q,p]=t1t2dt[δpaq˙a+paδq˙aδH(t,q,p)]=t1t2dt[δpaq˙a+ddt(paδqa)p˙aδqaHqaδqaHpaδpa]=t1t2dt[(q˙aHpa)δpa(p˙a+Hqa)δqa]+(paδqa)t1t2=0(13.26)\begin{aligned} \delta S[\boldsymbol q,\boldsymbol p]=&\int_{t_1}^{t_2}\mathrm dt[\delta p_a\dot q^a+p_a\delta \dot q^a-\delta H(t,\boldsymbol q,\boldsymbol p)]\\ =&\int_{t_1}^{t_2}\mathrm dt\left[\delta p_a\dot q^a+\frac{\mathrm d}{\mathrm dt}(p_a\delta q^a)-\dot p_a\delta q^a-\frac{\partial H}{\partial q^a}\delta q^a-\frac{\partial H}{\partial p_a}\delta p_a \right]\\ =&\int_{t_1}^{t_2}\mathrm dt\left[\left(\dot q^a-\frac{\partial H}{\partial p_a}\right)\delta p_a-\left(\dot p_a+\frac{\partial H}{\partial q^a} \right)\delta q^a \right]+\underbrace{\left.(p_a\delta q^a)\right|_{t_1}^{t_2}}_{=0} \end{aligned} \tag{13.26}

可以验证,哈密顿正则方程就是相空间拉格朗日量式(13.24)对应的欧拉-拉格朗日方程

ddt(Lq˙a)Lqa=0p˙a+Hqa=0(13.27)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\right)-\frac{\partial L}{\partial q^a}=0\quad \Rightarrow \quad \dot p_a+\frac{\partial H}{\partial q^a}=0\tag{13.27}

ddt(Lp˙a)Lpa=0q˙aHpa=0(13.28)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot p_a} \right)-\frac{\partial L}{\partial p_a}=0\quad \Rightarrow\quad \dot q^a-\frac{\partial H}{\partial p_a}=0\tag{13.28}

​ 我们进一步要求

δpa(t1)=δpa(t2)=0,a=1,,s(13.29)\delta p_a(t_1)=\delta p_a(t_2)=0,\quad a=1,\cdots,s\tag{13.29}

此时相空间拉格朗日量也就有相差时间全导数的任意性

paq˙aH(t,q,p)paq˙aH(t,q,p)+dF(t,q,p)dt(13.30)p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)\simeq p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)+\frac{\mathrm dF(t,\boldsymbol q,\boldsymbol p)}{\mathrm dt} \tag{13.30}

13.5 相空间中的演化

​ 哈密顿正则方程所描述的是相空间的坐标,即系统状态的演化。更一般地,系统的力学量或者说可观测量(observable)由状态决定,即相空间坐标的函数

​ 物理系统在任意时刻的状态可以用其相空间中的一个点来表示,称为这个系统在其相空间中的代表点。随着时间的演化,系统的代表点也会在相空间中移动,从而划出一条条轨迹,称为系统的相轨迹(phase trajectory)或者相流(phase flow)。对于不含时系统,相空间中的点代表系统完整的状态。从相空间中一个给定的点出发,物理系统的相流完全由哈密顿正则方程所唯一确定,即不含时系统的相流是永不相交的。相空间中相流的图示也被称作相图(phase diagram 或 phase potrait)。通过分析相图,可以直接得到系统演化的很多性质,而不需要具体求解运动方程。

​ 对于不含时系统,哈密顿量 HH 是运动常数。而

H(q,p)=constE(13.31)H(\boldsymbol q,\boldsymbol p)=const\equiv E\tag{13.31}

2s2s 维相空间中 2s12s-1 维的超曲面。因此,不含时系统的相轨迹在相空间中 H=constH=const 的超曲面上。对于单自由度系统,相流就是 2 维相平面上的曲线,亦即哈密顿量的等高线,如下如所示。根据哈密顿正则方程,相流的方向 v=(q˙,p˙)\boldsymbol v=(\dot{ q} ,\dot{ p}) 相当于哈密顿量的梯度 H=(Hq,Hp)\nabla H=\left(\frac{\partial H}{\partial q},\frac{\partial H}{\partial p} \right) 方向(由能量低指向能量高)“顺时针”转 π2\frac{\pi}{2} 角。

Example 13.10 单摆的相图

​ 单摆的拉格朗日量为 L=12ml2θ˙2+mglcosθL=\frac 12 ml^2\dot \theta ^2+mgl\cos\theta 。单摆只有 1 个自由度,其位形空间是 1 维圆周 S1\mathbf S^1 ,广义坐标 θ[π,π)\theta \in [-\pi,\pi) 具有 2π2\pi 周期性。 θ\theta 的共轭动量维 pθ=Lθ˙=ml2θ˙p_\theta=\frac{\partial L}{\partial \dot \theta}=ml^2\dot\theta 。于是哈密顿量为

H(θ,pθ)=pθθ˙L=pθ22ml2mglcosθH(\theta,p_\theta)=p_\theta\dot\theta-L=\frac{p_\theta^2}{2ml^2}-mgl\cos\theta

单摆的相空间是 2 维的,θ\theta 仍然具有 2π2\pi 的周期性,而 pθp_\theta 原则上可以取任意实数 pθR1p_\theta\in \mathbf R^1 ,所以单摆的相空间是一个 2 维柱面 R1×S1\mathbf R^1\times\mathbf S^1 。单摆的相流如图所示。

Example 13.11 开普勒问题的相图

​ 考虑在中心势场 V(r)=GmrV(r)=-\frac{Gm}{r} 中运动的粒子。由角动量守恒知,粒子做平面运动,取平面极坐标,拉格朗日量 L=12m(r˙2+r2ϕ˙2)+GmrL=\frac 12m(\dot r^2+r^2\dot\phi ^2)+\frac{Gm}{r} 。哈密顿量为

H=pr22m+pϕ22mr2GmrH=\frac{p_r^2}{2m}+\frac{p_\phi^2}{2mr^2}-\frac{Gm}{r}

由于 ϕ\phi 是循环坐标,pϕ=constJp_\phi=const\equiv J ,所以哈密顿量可写为 H=pr22m+J22mr2GmrH(r,pr)H=\frac{p_r^2}{2m}+\frac{J^2}{2mr^2}-\frac{Gm}{r}\equiv H(r,p_r) ,即等效为径向运动单自由度问题。 {r,pr}\{r,p_r\} 平面上的相图如图所示

Chapter 14 泊松括号

​ 从相空间的角度,哈密顿力学为物理系统的时间演化提供了更深入的描述,哈密顿力学的众多物理结论实际可以归结为相空间的几何性质。从这个意义上,哈密顿力学即相空间中的几何学。

14.1 相空间的辛结构

14.1.1 辛矩阵

​ 哈密顿力学的优越性之一是其将广义坐标和广义动量置于平等的地位。但是,哈密顿量正则方程看上去并不对称——广义坐标 {q}\{\boldsymbol q\} 和广义动量 {p}\{\boldsymbol p\} 的方程不但互为“交叉”,而且“反号”,即 q˙a\dot q^a 对应 Hpa\frac{\partial H}{\partial p_a} ,而 p˙a\dot p_a 对应 Hqa-\frac{\partial H}{\partial q^a} 。这种不对称性起源于相空间的内禀反对称的几何结构。

​ 对于单自由度的情形,相空间是 2 维的,将哈密顿正则方程写出矩阵形式

(q˙p˙)=(HpHq)=(0110)(HqHp)(14.1)\begin{pmatrix} \dot q\\ \dot p \end{pmatrix} =\begin{pmatrix} \frac{\partial H}{\partial p}\\ -\frac{\partial H}{\partial q} \end{pmatrix} = \begin{pmatrix} 0& 1 \\ -1 & 0 \end{pmatrix}\begin{pmatrix} \frac{\partial H}{\partial q}\\ \frac{\partial H}{\partial p} \end{pmatrix}\tag{14.1}

式(14.1)看上去对称许多,特别是 {q,p}\{q,p\} 的时间导数以及 HH{q,p}\{q,p\} 的导数顺序完全一致,但是代价是需要额外引入 2×22\times 2 的反对称矩阵

(0110)(14.2)\begin{pmatrix} 0 & 1\\ -1 &0 \end{pmatrix}\tag{14.2}

​ 推广到 ss 自由度的一般情形,既然广义坐标和广义动量是平等的,不妨用统一的符号 {ξα}\{\xi^\alpha\} 来表示 2s2s 个广义坐标和广义动量,即

ξα:={qα,α=1,,spαs,α=s+1,,2s(14.3)\xi^\alpha:=\begin{cases} q^\alpha,&\alpha=1,\cdots,s\\ p_{\alpha-s},&\alpha=s+1,\cdots,2s \end{cases}\tag{14.3}

定义 2s×2s2s\times 2s 的反对称矩阵

ωαβ:=(0s×s1s×s1s×s0s×s)(14.4)\omega ^{\alpha\beta}:=\begin{pmatrix} \mathbf{0}_{s\times s}&\mathbf{1}_{s\times s}\\ \mathbf{-1}_{s\times s}&\mathbf{0}_{s\times s} \end{pmatrix}\tag{14.4}

注意这里记 ωαβ\omega^{\alpha\beta} 的指标为上标,则哈密顿正则方程可以写成

ξ˙α=ωαβHξβ,α=1,,2s(14.5)\dot\xi^\alpha =\omega^{\alpha\beta}\frac{\partial H}{\partial \xi^\beta},\quad \alpha=1,\cdots,2s\tag{14.5}

​ 记 ωαβ\omega^{\alpha\beta} 的逆矩阵为 ωαβ\omega_{\alpha\beta} ,有

ωαβ:=(0s×s1s×s1s×s0s×s)(14.6)\omega _{\alpha\beta}:=\begin{pmatrix} \mathbf{0}_{s\times s}&\mathbf{-1}_{s\times s}\\ \mathbf{1}_{s\times s}&\mathbf{0}_{s\times s} \end{pmatrix}\tag{14.6}

式(14.4)和(14.6)所定义的 ωαβ\omega^{\alpha\beta}ωαβ\omega_{\alpha\beta}2s×2s2s\times 2s 的反对称矩阵,被称为辛矩阵(symplectic matrix)。习惯上用矩阵 ω\boldsymbol \omega 代表下指标的 ωαβ\omega_{\alpha\beta}ω1\boldsymbol\omega^{-1} 代表上指标的 ωαβ\omega^{\alpha\beta} ,可以验证辛矩阵满足

ωT=ω=ω1(14.7)\boldsymbol \omega^T=-\boldsymbol \omega=\boldsymbol \omega^{-1}\tag{14.7}

用指标的形式可以写成

ωβα=ωαβ=(ω1)αβδαρδβσωρσ(14.8)\omega_{\beta\alpha}=-\omega_{\alpha\beta}=(\boldsymbol \omega^{-1})_{\alpha\beta}\equiv\delta_{\alpha\rho}\delta_{\beta\sigma}\omega^{\rho\sigma}\tag{14.8}

可以看出,辛矩阵的行列式为

detω=1(14.9)\det \boldsymbol \omega=1\tag{14.9}

在涉及辛矩阵的计算中,需要额外留意指标的左右顺序。

14.1.2 哈密顿矢量场

​ 哈密顿量 H=H(t,ξ)H=H(t,\boldsymbol \xi) 是定于在相空间中的标量函数,且具有能量量纲,不妨将其视为某种势能。于是 Hξα\frac{\partial H}{\partial \xi^\alpha} 可以被视为哈密顿量在相空间中的梯度。哈密顿正则方程(14.5)的右边其实就是这个梯度,只不过乘上了辛矩阵

ωαβHξβXHα,α=1,,2s(14.10)\omega^{\alpha\beta}\frac{\partial H}{\partial \xi^{\beta}}\equiv X^\alpha_H,\quad \alpha=1,\cdots,2s\tag{14.10}

这里 XHαX^\alpha_H 被称为哈密顿矢量场(Hamiltonian vector field),其是相空间中的矢量场。

​ 利用哈密顿矢量场,哈密顿正则方程可以写成

ξ˙α=XHα,α=1,,2s(14.11)\dot\xi^\alpha=X_H^\alpha,\quad \alpha=1,\cdots,2s\tag{14.11}

若用列矩阵 ξ\boldsymbol\xi 表示相空间坐标,H\nabla H 代表哈密顿量的梯度,上式可以用矩阵形式写成

ξ˙=ω1HXH(14.12)\dot{\boldsymbol\xi}=\boldsymbol \omega^{-1}\nabla H\equiv \boldsymbol X_{H}\tag{14.12}

式(14.11)意味着,相流的“流向”(切矢量)即哈密顿矢量场,辛矩阵 ω1\boldsymbol \omega^{-1} 起到了将哈密顿量的梯度 H\nabla H “扭转”到相流方向的作用。

14.2 辛内积与泊松括号

14.2.1 相空间中的“辛内积”

​ 相空间最重要的几何结构不是度规,而是辛矩阵。位形空间中的度规是对称的,而相空间中的辛矩阵是反对称的。但是辛矩阵可以起到和度规类似的作用。例如,给定相空间中的两个矢量 XαX_\alphaYβY_\beta ,可以定义这样一个对象

ωαβXαYβ(14.13)\omega^{\alpha\beta}X_\alpha Y_\beta\tag{14.13}

其效果和内积一样,输入两个矢量,输出一个标量。因为这个内积是用辛矩阵定义的,不妨称之为"辛内积"(symplectic inner product)。辛内积的几何意义——两个矢量的辛内积就是其所构成的平行四边形的面积。

14.2.2 泊松括号的定义

​ 在位形空间中,取坐标为 {q}\{\boldsymbol q\} ,如果矢量 AaA_aBaB_a 来源于标量函数的梯度,即 Aa=fqaA_a=\frac{\partial f}{\partial q^a}Ba=gqaB_a=\frac{\partial g}{\partial q^a} ,则度规定义的内积为

f,g:=gabfqagqb(14.14)\langle f,g\rangle:=g^{ab}\frac{\partial f}{\partial q^a}\frac{\partial g}{\partial q^b}\tag{14.14}

不妨称之为“内积括号”。从“输入/输出”的角度,其作用相当于一个机器,输入两个函数 ffgg ,输出一个函数 f,g\langle f,g\rangle 。度规是对称的,因此“内积括号”对于其两个输入也是对称的,即有 f,g=g,f\langle f,g\rangle=\langle g,f \rangle 。若式(14.14)中 fqaf\to q^agqbg\to q^b ,则有

qa,qb=gcdqaqcqbqd=gcdδcaδdb=gab(14.15)\langle q^a,q^b\rangle=g^{cd}\frac{\partial q^a}{\partial q^c}\frac{\partial q^b}{\partial q^d}=g^{cd}\delta^a_c\delta ^b_d=g^{ab}\tag{14.15}

可见位形空间坐标的内积括号即度规。

​ 同样,我们可以定义泊松括号。在 13.5 节开头即指出,力学量即相空间上的函数,给定两个力学量 f=f(t,ξ)f=f(t,\boldsymbol \xi)g=g(t,ξ)g=g(t,\boldsymbol\xi) ,其在相空间中的梯度分别为

Xα=fξα,Yα=gξα(14.16)X_\alpha=\frac{\partial f}{\partial \xi^\alpha},\quad Y_\alpha=\frac{\partial g}{\partial \xi^{\alpha}}\tag{14.16}

为相空间上的矢量场。用辛矩阵定义的“辛内积”为

[f,g]:=ωαβfξαgξβ(14.17)[f,g]:=\omega^{\alpha\beta}\frac{\partial f}{\partial \xi^{\alpha}}\frac{\partial g}{\partial \xi^\beta}\tag{14.17}

即称为力学量 ffgg泊松括号(Poisson bracket)。泊松括号也相当于一个机器,输入两个函数 ffgg ,输出一个函数 [f,g][f,g] 。因为辛矩阵是反对称的,因此泊松括号也是反对称的,即有 [f,g]=[g,f][f,g]=-[g,f] 。泊松括号的几何意义也是非常直观的,即力学量的梯度 f\nabla fg\nabla g (两个矢量)所构成的平行四边形的面积,如图所示

​ 在实际计算中,利用辛矩阵 ωαβ\omega^{\alpha\beta} 的具体形式,可以得到泊松括号更加具体的表达式。

 [f,g]=α=12sβ=12sωαβfξαgξβ=α=1sβ=1sωαβfξαgξβ=0+α=1sβ=s+12sωαβfξαgξβ=a=1sb=1sδabfqagpb+α=s+12sβ=1sωαβfξαgξβ=a=1sb=1s(δab)fpagqb+α=s+12sβ=s+12sωαβfξαgξβ=0\begin{aligned} \ [f,g]=&\sum_{\alpha=1}^{2s}\sum_{\beta=1}^{2s}\omega^{\alpha\beta}\frac{\partial f}{\partial \xi^{\alpha}}\frac{\partial g}{\partial \xi^\beta}\\ =&\underbrace{\sum_{\alpha=1}^s\sum_{\beta=1}^s\omega^{\alpha \beta}\frac{\partial f}{\partial \xi^\alpha}{\frac{\partial g}{\partial \xi^\beta}}}_{=0}+\underbrace{\sum_{\alpha=1}^s\sum_{\beta=s+1}^{2s}\omega^{\alpha\beta}\frac{\partial f}{\partial \xi^\alpha}{\frac{\partial g}{\partial \xi^\beta}}}_{=\sum_{a=1}^s\sum_{b =1}^s\delta^{ab}\frac{\partial f}{\partial q^a}\frac{\partial g}{\partial p_b}}\\ +&\underbrace{\sum_{\alpha=s+1}^{2s}\sum_{\beta=1}^{s}\omega^{\alpha\beta}\frac{\partial f}{\partial \xi^\alpha}{\frac{\partial g}{\partial \xi^\beta}}}_{=\sum_{a=1}^s\sum_{b =1}^s(-\delta^{ab})\frac{\partial f}{\partial p_a}\frac{\partial g}{\partial q^b}}+\underbrace{\sum_{\alpha=s+1}^{2s}\sum_{\beta=s+1}^{2s}\omega^{\alpha \beta}\frac{\partial f}{\partial \xi^\alpha}{\frac{\partial g}{\partial \xi^\beta}}}_{=0} \end{aligned}

[f,g]=fqagpafpagqa(14.18)[f,g]=\frac{\partial f}{\partial q^a}\frac{\partial g}{\partial p_a}-\frac{\partial f}{\partial p_a}\frac{\partial g}{\partial q^a}\tag{14.18}

14.2.3 泊松括号的性质

​ 相空间最重要的几何结构是反对称的辛矩阵。泊松括号即使这种几何结构在相空间函数(力学量)之间代数关系上的反映。对于函数 f,g,hf,g,h ,以及常数 a,ba,b ,泊松括号具有以下性质。

​ (1)反对称(antisymmetric)

[f,g]=[g,f](14.19)[f,g]=-[g,f]\tag{14.19}

​ (2)双线性(bilinear):所谓线性,即使满足“加法”和“数乘”。对于左边

[af+bg,h]=加法[af,h]+[bg,h]=数乘a[f,h]+b[g,h](14.20)[af+bg,h]\xlongequal{加法}[af,h]+[bg,h]\xlongequal{数乘}a[f,h]+b[g,h]\tag{14.20}

对于右边,同样有

[f,ag+bh]=加法[f,ag]+[f,bh]=数乘a[f,g]+b[f,h](14.21)[f,ag+bh]\xlongequal{加法}[f,ag]+[f,bh]\xlongequal{数乘}a[f,g]+b[f,h]\tag{14.21}

​ (3)莱布尼茨规则(Leibniz’s rule):对于左边

[fg,h]=[f,h]g+f[g,h](14.22)[fg,h]=[f,h]g+f[g,h]\tag{14.22}

对于右边

[f,gh]=g[f,h]+[f,g]h(14.23)[f,gh]=g[f,h]+[f,g]h\tag{14.23}

​ (4)雅可比恒等式(Jacobi identity):可以证明,对于 3 个函数,有

[[f,g],h]+[[g,h],f]+[[h,f],g]=0(14.24)[[f,g],h]+[[g,h],f]+[[h,f],g]=0\tag{14.24}

以及

[f,[g,h]]+[g,[h,f]]+[h,[f,g]]=0(14.25)[f,[g,h]]+[g,[h,f]]+[h,[f,g]]=0\tag{14.25}

proof:

 [f,[g,h]]=ωαβfξα[g,h]ξβ=ωαβfξαξβ(ωρσgξρhξσ)=fξαωαβ2gξβξρωρσhξσ+fξαωαβ2hξβξσωρσgξρ\begin{aligned} \ [f,[g,h]]=&\omega^{\alpha\beta}\frac{\partial f}{\partial \xi^{\alpha}}\frac{\partial [g,h]}{\partial \xi^\beta}=\omega^{\alpha\beta}\frac{\partial f}{\partial \xi^{\alpha}}\frac{\partial}{\partial \xi^\beta}\left(\omega^{\rho\sigma}\frac{\partial g}{\partial \xi^\rho}\frac{\partial h}{\partial \xi^\sigma} \right)\\ =&\frac{\partial f}{\partial \xi^\alpha}\omega^{\alpha\beta}\frac{\partial ^2g}{\partial\xi^\beta\partial \xi^\rho}\omega^{\rho\sigma}\frac{\partial h}{\partial \xi^\sigma}+\frac{\partial f}{\partial \xi^\alpha}\omega^{\alpha\beta}\frac{\partial ^2h}{\partial \xi^\beta\partial \xi^\sigma}\omega^{\rho\sigma}\frac{\partial g}{\partial \xi^\rho} \end{aligned}

观察上式结构,定义

J(f,g,h)ωαβωρσfξα2gξβξρhξσJ(f,g,h)\equiv\omega^{\alpha\beta}\omega^{\rho\sigma}\frac{\partial f}{\partial \xi^\alpha}\frac{\partial ^2g}{\partial \xi^\beta\partial \xi^\rho}\frac{\partial h}{\partial \xi^\sigma}

注意有对称性 J(f,g,h)=J(h,g,f)J(f,g,h)=J(h,g,f),则

[f,[g,h]]=J(f,g,h)J(f,h,g)J(f,g,h)J(g,h,f)[f,[g,h]]=J(f,g,h)-J(f,h,g)\equiv J(f,g,h)-J(g,h,f)

于是

 [f,[g,h]]+[g,[h,f]]+[h,[f,g]]=J(f,g,h)J(g,h,f)+J(g,h,f)J(h,f,g)+J(h,f,g)J(f,g,h)=0\begin{aligned} \ &[f,[g,h]]+[g,[h,f]]+[h,[f,g]]\\ =&J(f,g,h)-J(g,h,f)+J(g,h,f)-J(h,f,g)+J(h,f,g)-J(f,g,h)=0 \end{aligned}

	(5)链式法则(chain rule):对于复合函数,有

[F(f),g]=Ff[f,g],[f,G(g)]=[f,g]Gg(14.26)[F(f),g]=\frac{\partial F}{\partial f}[f,g],\quad [f,G(g)]=[f,g]\frac{\partial G}{\partial g}\tag{14.26}

​ (6)对参数的偏导数:如果力学量 ffgg 依赖于某独立与相空间坐标的参数 λ\lambda(包括时间 tt),则泊松括号对参数 λ\lambda 偏导数为

[f,g]λ=[fλ,g]+[f,gλ](14.27)\frac{\partial [f,g]}{\partial \lambda}=\left[\frac{\partial f}{\partial \lambda},g \right]+\left[f,\frac{\partial g}{\partial \lambda} \right] \tag{14.27}

14.2.4 基本泊松括号

​ 力学量 ff 和相空间坐标的泊松括号为

[ξα,f]=ωρβξαξρfξβ=ωαβfβ[\xi^\alpha,f]=\omega^{\rho\beta}\frac{\partial \xi^\alpha}{\partial \xi^\rho}\frac{\partial f}{\partial \xi^\beta}=\omega^{\alpha\beta}\frac{\partial f}{\partial \beta}

因为上式对任意力学量 ff 都成立。因此可以写成

[ξα,]=ωαβξβα=1,,2s(14.28)[\xi^\alpha,\bullet]=\omega^{\alpha\beta}\frac{\partial \bullet}{\partial \xi^\beta},\quad \alpha=1,\cdots,2s\tag{14.28}

这里 \bullet 代表泊松括号作用的对象,式(14.28)的意义可以从“泊松括号是相空间中的求导运算”这个角度来理解。利用辛矩阵的具体形式,可以将上式写成

([q,][p,])=(0110)(qp)=(pq)\begin{pmatrix} [\boldsymbol q,\bullet]\\ [\boldsymbol p,\bullet] \end{pmatrix}=\begin{pmatrix} 0&1\\ -1&0 \end{pmatrix} \begin{pmatrix} \frac{\partial \bullet}{\partial\boldsymbol q}\\ \frac{\partial \bullet}{\partial\boldsymbol p} \end{pmatrix}=\begin{pmatrix} \frac{\partial \bullet}{\partial p}\\ -\frac{\partial \bullet}{\partial \boldsymbol q} \end{pmatrix}

用指标即有

[qa,]=pa,[pa,]=qa,a=1,,s(14.29)[q^a,\bullet]=\frac{\partial \bullet}{\partial p_a},\quad [p_a,\bullet]=-\frac{\partial \bullet}{\partial q^a},\quad a=1,\cdots,s\tag{14.29}

式(14.29)意味着,任意力学量与坐标的泊松括号相当于对动量求偏导数,与动量的泊松括号相当于对坐标求偏导数(相差负号)。

​ 根据链式法则,任意两个力学量 ffgg 的泊松括号可以写成

[f,g]=fξα[ξα,ξβ]gξβ(14.30)[f,g]=\frac{\partial f}{\partial \xi^\alpha}[\xi^\alpha,\xi^\beta]\frac{\partial g}{\partial \xi^\beta}\tag{14.30}

可见,任意两个力学量的泊松括号都可以归结为相空间坐标之间泊松括号 [ξα.ξβ][\xi^\alpha.\xi^\beta] ,根据泊松括号定义有

[ξα,ξβ]=ωρσξαξρξβξσ=ωαβ,α,β=1,,2s(14.31)[\xi^\alpha,\xi^\beta]=\omega^{\rho\sigma}\frac{\partial \xi^\alpha}{\partial \xi^\rho}\frac{\partial \xi^\beta}{\partial \xi^\sigma}=\omega^{\alpha\beta},\quad \alpha,\beta=1,\cdots,2s\tag{14.31}

可以相空间坐标的泊松括号正是辛矩阵。利用辛矩阵的具体形式,上式可以写成

[qa,qb]=0,[pa,pb]=0,[qa,pb]=δba,a,b=1,,s(14.32)[q^a,q^b]=0,\quad [p_a,p_b]=0,\quad [q^a,p_b]=\delta^a_b,\quad a,b=1,\cdots,s\tag{14.32}

式(14.31)和式(14.32)被称为基本泊松括号(fundamental Poisson brackets)。

Example 14.1 泊松括号的计算

​ 以单自由度系统为例,想空间坐标记为 {q,p}\{q,p\} ,有

[q2,p2]=(q2)q[q,p](p2)p=2pq[q^2,p^2]=\frac{\partial (q^2)}{\partial q}[q,p]\frac{\partial (p^2)}{\partial p}=2pq

[q2p,p2q]=p[q2,p2q]+q2[p,p2q]=pq[q2,p2]+q2p2[p,q]=3q2p2[q^2p,p^2q]=p[q^2,p^2q]+q^2[p,p^2q]=pq[q^2,p^2]+q^2p^2[p,q]=3q^2p^2

以及

 [q2+p2,qp]=[q2,qp]+[p2,qp]=q[q2,p]+p[p2,q]=q(q2)q[q,p]+p(p2)p[p,q]=2q22p2\begin{aligned} \ [q^2+p^2,qp]=&[q^2,qp]+[p^2,qp]=q[q^2,p]+p[p^2,q] \\ &= q\frac{\partial (q^2)}{\partial q}[q,p]+p\frac{\partial(p^2)}{\partial p}[p,q]=2q^2-2p^2 \end{aligned}

14.3 力学量的演化

14.3.1 用泊松括号表达的动力学方程

​ 考虑力学量 f=f(t,q,p)f(t,ξ)f=f(t,\boldsymbol q,\boldsymbol p)\equiv f(t,\boldsymbol \xi) 的时间演化,利用哈密顿正则方程,得到

f˙=ft+ξ˙αfξα=ft+fξαwαβHξβ=[f,H](14.33)\dot f=\frac{\partial f}{\partial t}+\dot\xi^\alpha\frac{\partial f}{\partial \xi^\alpha}=\frac{\partial f}{\partial t}+\underbrace{\frac{\partial f}{\partial \xi^\alpha}w^{\alpha\beta}\frac{\partial H}{\partial \xi^\beta}}_{=[f,H]}\tag{14.33}

任一力学量 ff 随时间的变化率为

f˙=ft+[f,H](14.34)\dot f=\frac{\partial f}{\partial t}+[f,H]\tag{14.34}

这就是泊松括号表达的动力学方程。描述物理系统随时间演化的方程可以有各种等价的表述,包括已经知道的牛顿运动定律、拉格朗日方程以及哈密顿正则方程。但是,这些方程更多地只关注坐标本身。用泊松括号表达的式(14.34)则将动力学方程“提升”至任意力学量,是动力学在相空间中更加统一且优美的表述。

​ 既然式(14.40)对于任意力学量都成立,当然也包括相空间坐标。将式(14.34)中的 ff 换为相空间坐标 ξα\xi^\alpha ,并利用式(14.34)

ξ˙α=ξαt=0+[ξα,H]=ωαβHξβ(14.35)\dot \xi^\alpha=\underbrace{\frac{\partial \xi^\alpha}{\partial t}}_{=0}+[\xi^\alpha,H]=\omega^{\alpha\beta}\frac{\partial H}{\partial \xi^\beta}\tag{14.35}

正是哈密顿正则方程。

14.3.2 运动常数

​ 根据式(14.34),任一力学量 ff 为运动常数的充要条件即

f˙=ft+[f,H]=0(14.36)\dot f=\frac{\partial f}{\partial t}+[f,H]=0\tag{14.36}

如果 ff 不显含时间,即 ft=0\frac{\partial f}{\partial t}=0 ,则

f˙=[f,H]=0(14.37)\dot f=[f,H]=0\tag{14.37}

因此不显含时间的力学量 ff 是运动常数的充要条件即其与哈密顿量 HH 的泊松括号为零。将“ ··· 与 ··· 的泊松括号为零”称为“ ··· 与 ··· 是(泊松)对易(commute)的” 。

如果将式(14.34)作用到哈密顿量本身,得到

dHdt=Ht+[H,H]=0=Ht(14.38)\frac{\mathrm dH}{\mathrm dt}=\frac{\partial H}{\partial t}+\underbrace{[H,H]}_{=0}=\frac{\partial H}{\partial t}\tag{14.38}

14.3.3 泊松定理

​ 由式(14.34),并利用泊松括号对参数求导的性质

d[f,g]dt=[f,g]t+[[f,g],H]=[ft,g]+[f,gt]+[[f,g],H](14.39)\frac{\mathrm d[f,g]}{\mathrm dt}=\frac{\partial [f,g]}{\partial t}+[[f,g],H]=\left[\frac{\partial f}{\partial t},g \right]+\left[f,\frac{\partial g}{\partial t}\right]+[[f,g],H]\tag{14.39}

利用雅可比恒等式,[[f,g],H]=[[g,H],f][[H,f],g][[f,g],H]=-[[g,H],f]-[[H,f],g] 。代入式(14.39)得到

d[f,g]dt=[ft,g]+[f,gt][[g,H],f][[H,f],g]=[ft+[f,H],g]+[f,gt+[g,H]]=[dfdt,g]+[f,dgdt](14.40)\begin{aligned} \frac{\mathrm d[f,g]}{\mathrm dt}=&\left[\frac{\partial f}{\partial t},g \right]+\left[f,\frac{\partial g}{\partial t} \right]-[[g,H],f]-[[H,f],g]\\ =&\left[\frac{\partial f}{\partial t}+[f,H],g\right]+\left[f,\frac{\partial g}{\partial t}+[g,H] \right]\\ =&\left[\frac{\mathrm df}{\mathrm dt},g \right]+\left[f,\frac{\mathrm dg}{\mathrm dt} \right] \end{aligned}\tag{14.40}

这意味着对时间参数 tt 的“全导数”(时间演化),泊松括号也满足莱布尼茨规则。显然,如果 ffgg 是系统的两个运动常数,则两者的泊松括号 [f,g][f,g] 也是系统的运动常数,亦即

dfdt=0,dgdt=0d[f,g]dt=0(14.41)\frac{\mathrm df}{\mathrm dt}=0,\frac{\mathrm dg}{\mathrm dt}=0\quad \Rightarrow \quad \frac{\mathrm d[f,g]}{\mathrm dt}=0\tag{14.41}

这个结论称为泊松定理(Poisson theorem)。由以上推导可知,无论运动常数是否显含时间,泊松定理都是成立的。

​ 因为有限自由度系统运动常数的个数总是有限的,所以利用泊松定理不可能产生无限多个独立的运动常数。最终将得到一个运动常数的几何 C{C1,C2,,CN}\mathcal C\equiv\{C_1,C_2,\cdots,C_N\} ,其中任一两个运动常数的泊松括号将无法再产生新的独立的运动常数。换句话说,此时 C\mathcal C 中任意两个运动常熟的泊松括号总能表达成 C\mathcal C 中运动常数的线性组合,亦即

[Ci,Cj]=k=1NfijkCk(14.42)[C_i,C_j]=\sum_{k=1}^Nf^k_{ij}C_k\tag{14.42}

数学上将这一性质称作运动常数的集合 C\mathcal C 在泊松括号的作用下是“封闭”的。对易关系式(14.41)与第 11 章中无穷小转动生成元的矩阵对易子式完全类似,即构成所谓李代数,这里的系数 fijkf^k_{ij} 即结构常数。

14.4 角动量的泊松括号

​ 3 维欧氏空间中,一个粒子相对于原点的角动量矢量定义为 J=x×p\boldsymbol J=\boldsymbol x\times\boldsymbol p ,其中 x\boldsymbol x 是粒子的位矢, p\boldsymbol p 是粒子的线动量。角动量矢量可以用指标写成

Ji=ϵijkxjpk(14.43)J^i=\epsilon^{ijk}x_jp_k\tag{14.43}

两边同乘 ϵ\epsilon-符号,有

ϵijkJk=ϵijkϵkmnxmpn=(δimδjnδinδjm)xmpn=xipjxjpi(14.44)\epsilon_{ijk}J^k=\epsilon_{ijk}\epsilon^{kmn}x_mp_n=(\delta_i^m\delta_j^n-\delta_i^n\delta_j^m)x_mp_n=x_ip_j-x_jp_i\tag{14.44}

14.4.1 角动量泊松括号的计算

​ 利用泊松括号的性质和基本泊松括号,有

[Ji,xj]=[ϵiklxkpl,xj]=ϵiklxk[pl,xj]=ϵiklxkδlj=ϵijkxk(14.45)[J^i,x^j]=[\epsilon^{ikl}x_kp_l,x^j]=\epsilon^{ikl}x_k[p_l,x^j]=-\epsilon^{ikl}x_k\delta_l^j=\epsilon^{ijk}x_k\tag{14.45}

以及

[Ji,pj]=[ϵiklxkpl,pj]=ϵiklpl[xk,pj]=ϵiklplδkj=ϵijkpk(14.46)[J^i,p^j]=[\epsilon^{ikl}x_kp_l,p^j]=\epsilon^{ikl}p_l[x_k,p^j]=\epsilon^{ikl}p_l\delta_k^j=\epsilon^{ijk}p_k\tag{14.46}

于是

 [Ji,Jj]=[Ji,ϵjklxkpl]=ϵjkl[Ji,xk]pl+ϵjklxk[Ji,pl]=ϵjklϵikmxmpl+ϵjklϵilmxkpm=(δjiδlmδjmδli)xmpl+(δjmδkiδjiδkm)xkpm=xipjxjpi=ϵijkJk(14.47)\begin{aligned} \ [J^i,J^j]=&[J^i,\epsilon^{jkl}x_kp_l]=\epsilon^{jkl}[J^i,x_k]p_l+\epsilon^{jkl}x_k[J^i,p_l]\\ =&\epsilon^{jkl}\epsilon^{ikm}x_mp_l+\epsilon^{jkl}\epsilon^{ilm}x_kp_m\\ =&(\delta^{ji}\delta^{lm}-\delta^{jm}\delta^{li})x_mp_l+(\delta^{jm}\delta^{ki}-\delta^{ji}\delta^{km})x_kp_m\\ =&x^ip^j-x^jp^i=\epsilon^{ijk}J_k \end{aligned}\tag{14.47}

用分量表示即

[J1,J2]=J3,[J2,J3]=J1,[J3,J1]=J2(14.48)[J^1,J^2]=J^3,\quad [J^2,J^3]=J^1,\quad [J^3,J^1]=J^2\tag{14.48}

3 维空间中角动量分量的泊松括号对易关系式与 3 维无穷小转动生成元的李代数式有异曲同工之妙。由此再次可见角动量与空间转动之间的深刻联系。此外,式(14.47)还表明了角动量的 3 个分量不可能同时作为正则变量(无论是作为正则坐标还是正则动量),因为这违背了基本泊松括号。

​ 因为 x\boldsymbol xp\boldsymbol p 只存在 3 中基本的标量形式的缩并

x2xixi,p2pipi,xpxipi(14.49)\boldsymbol x^2\equiv x_ix^i,\quad \boldsymbol p^2\equiv p_ip^i,\quad \boldsymbol x\cdot\boldsymbol p\equiv x^ip_i\tag{14.49}

所以相空间中任意标量函数 f=f(t,x,p)f=f(t,\boldsymbol x,\boldsymbol p) 必然只能是这 3 中基本缩并的函数,即

f=f(t,x2,p2,xp)(14.50)f=f(t,\boldsymbol x^2,\boldsymbol p^2,\boldsymbol x\cdot\boldsymbol p)\tag{14.50}

利用泊松括号可以验证

[Ji,x2]=[Ji,p2]=[Ji,xp]=0(14.51)[J^i,\boldsymbol x^2]=[J^i,\boldsymbol p^2]=[J^i,\boldsymbol x\cdot\boldsymbol p]=0\tag{14.51}

proof:

[Ji,x2]=[Ji,xjxj]=2[Ji,xj]xj=2ϵjikxkxj=0[J^i,\boldsymbol x^2]=[J^i,x_jx^j]=2[J^i,x_j]x^j=2\epsilon^{ik}_j x_k x^j=0

剩余两个同理。

于是利用链式法则,有

[Ji,f]=f(x2)[Ji,x2]+Ji(p2)[Ji,p2]+Ji(xp)[Ji,xp]=0[J^i,f]=\frac{\partial f}{\partial (\boldsymbol x^2)}[J^i,\boldsymbol x^2]+\frac{\partial J^i}{\partial (\boldsymbol p^2)}[J^i,\boldsymbol p^2]+\frac{\partial J^i}{\partial (\boldsymbol x\cdot\boldsymbol p)}[J^i,\boldsymbol x\cdot\boldsymbol p]=0

即角动量矢量与相空间上任意标量函数对易

[Ji,f]=0(14.52)[J^i,f]=0\tag{14.52}

​ 相空间中任意矢量函数 Vi=Vi(t,x,p)V^i=V^i(t,\boldsymbol x,\boldsymbol p) 只能时 3 中基本矢量 x\boldsymbol xp\boldsymbol pJ\boldsymbol J 的线性组合,即

Vi=fxi+gpi+hJi(14.53)V^i=fx^i+gp^i+hJ^i\tag{14.53}

其中 f,g,hf,g,h 都是标量。有

 [Ji,Vj]=[Ji,fxj+gpj+hJj]=f[Ji,xj]+g[Ji,pj]+h[Ji,Jj]=ϵijk(fxk+gpk+hJk)\begin{aligned} \ [J^i,V^j]=&[J^i,fx^j+gp^j+hJ^j]=f[J^i,x^j]+g[J^i,p^j]+h[J^i,J^j]\\ =&\epsilon^{ijk}(fx_k+gp_k+hJ_k) \end{aligned}

即角动量矢量与相空间上任意矢量函数的泊松括号为

[Ji,Vj]=ϵijkVk[J^i,V^j]=\epsilon^{ijk}V_k

14.4.2 开普勒问题

​ 开普勒问题的哈密顿量 H=p22mαrH=\frac{\boldsymbol p^2}{2m}-\frac \alpha r 不含时,因此哈密顿量 HH 是运动常数。因为哈密顿量是相空间上的标量函数,于是必然有

[Ji,H]=0(14.54)[J^i,H]=0\tag{14.54}

式(14.54)意味着角动量矢量 J\boldsymbol J 也是运动常数。对于 LRL 矢量,可写为

Ai=ϵi ⁣jkpjJkαmrxi(14.55)A^i=\epsilon^i\!_{jk}p^jJ^k-\alpha\frac{m}{r}x^i\tag{14.55}

可以验证

[Ai,H]=0(14.56)[A^i,H]=0\tag{14.56}

proof:

x˙i=Hpi=pimp˙i=Hxi=αr2rxi=αxir3\begin{aligned} \dot x^i=&\frac{\partial H}{\partial p_i}=\frac{p^i}{m}\\ \dot p_i=&-\frac{\partial H}{\partial x^i}=-\frac{\alpha}{r^2}\frac{\partial r}{\partial x^i}=-\frac{\alpha x_i}{r^3} \end{aligned}

化简 [Ai,H][A^i,H]

 [Ai,H]=ϵi ⁣jk[pj,H]Jkαmr[xi,H]αmxi[1r,H]=ϵi ⁣jkαxjr3ϵk ⁣mnxmpnαpir+αr3xixjpj=αr3xixjpj+αr3xjxjpiαrpi+αr3xixjpj=0\begin{aligned} \ [A^i,H]=&\epsilon^i\!_{jk}[p^j,H]J^k-\frac{\alpha m}{r}[x^i,H]-\alpha m x^i \left[\frac{1}{r},H\right]\\ =&-\epsilon^i\!_{jk}\frac{\alpha x^j}{r^3}\epsilon^{k}\!_{mn}x_mp_n-\frac{\alpha p^i}{r}+\frac{\alpha}{r^3}x^ix_jp^j\\ =&-\frac{\alpha}{r^3}x^ix^jp_j+\frac{\alpha}{r^3}x_jx^jp^i-\frac{\alpha}{r}p^i+\frac{\alpha}{r^3}x^ix^jp_j=0 \end{aligned}

即 LRL 矢量 A\boldsymbol A 与哈密顿量对易,所以是运动常数。

​ 角动量矢量与 LRL 矢量的泊松括号为

[Ji,Aj]=ϵij ⁣kAk(14.57)[J^i,A^j]=\epsilon^{ij}{}\!_kA^k\tag{14.57}

可以验证,LRL 矢量与自身的泊松括号为

[Ai,Aj]=2mHϵij ⁣kJk[A^i,A^j]=-2mH\epsilon^{ij}\!_kJ^k

Chapter 15 正则变换

​ 先按照杨望老师讲义的思路进行。

15.1 正则变换的概念

​ 考虑 {q,p}\{\boldsymbol q,\boldsymbol p\} 向一组新的正则变量 {Q,P}\{\boldsymbol Q,\boldsymbol P\} 的变换,即

Q=Q(q,p,t),P=P(q,p,t)(15.1)\boldsymbol Q=\boldsymbol Q(\boldsymbol q,\boldsymbol p,t),\quad \boldsymbol P=\boldsymbol P(\boldsymbol q,\boldsymbol p,t)\tag{15.1}

若任取哈密顿量 H=H(q,p,t)H=H(\boldsymbol q,\boldsymbol p,t) 。设 {q,p}\{\boldsymbol q,\boldsymbol p\} 满足以 HH 为哈密顿量的正则方程

q˙=Hp,p˙=Hq(15.2)\dot{\boldsymbol q}=\frac{\partial H}{\partial \boldsymbol p},\quad \dot{\boldsymbol p}=-\frac{\partial H}{\partial \boldsymbol q}\tag{15.2}

若存在一个新的哈密顿量 H~=H~(Q,P,t)\tilde H=\tilde H(\boldsymbol Q,\boldsymbol P,t),使得经式(15.1)变换得到的 {Q,P}\{\boldsymbol Q,\boldsymbol P \} 满足以 H~(Q,P)\tilde H(\boldsymbol Q,\boldsymbol P) 为哈密顿量的正则方程,即

Q˙=H~P,P˙=H~Q(15.3)\dot{\boldsymbol Q}=\frac{\partial \tilde H}{\partial \boldsymbol P},\quad \dot{\boldsymbol P}=-\frac{\partial \tilde H}{\partial \boldsymbol Q}\tag{15.3}

则式(15.1)的变换被称为正则变换。

15.2 正则变换的充要条件

15.2.1 正则变换的充分条件

​ 利用辛形式 J\boldsymbol J ,正则方程可以写为

ξ˙=JξH(15.4)\dot{\boldsymbol \xi}=\boldsymbol J\nabla_{\boldsymbol\xi} H \tag{15.4}

我们将变换后的正则变量记为 η\boldsymbol\eta 。正则变换 {q,p}{Q,P}\{\boldsymbol q,\boldsymbol p\} \to \{\boldsymbol Q,\boldsymbol P\} 记为

η=η(ξ,t)(15.5)\boldsymbol\eta=\boldsymbol\eta(\boldsymbol \xi,t)\tag{15.5}

根据正则变换定义,存在哈密顿量 H~(η,t)\tilde H(\boldsymbol\eta,t) ,使得

η˙a=JabH~ηb,a=1,,2s(15.6)\dot\eta_a=J_{ab}\frac{\partial \tilde H}{\partial \eta_b},\quad a=1,\cdots,2s\tag{15.6}

式(15.4)左边可以写为

ξ˙a=ξaηbη˙b+ξat=ξaηbJbcH~ηc+ξat(15.7)\dot\xi_a=\frac{\partial \xi_a}{\partial \eta_b}\dot \eta_b+\frac{\partial \xi_a}{\partial t}=\frac{\partial \xi_a}{\partial \eta_b}J_{bc}\frac{\partial\tilde H}{\partial \eta_c}+\frac{\partial \xi_a}{\partial t} \tag{15.7}

JabHξb=ξaηbJbcH~ηc+ξat(15.8)J_{ab}\frac{\partial H}{\partial \xi_b}=\frac{\partial \xi_a}{\partial \eta_b}J_{bc}\frac{\partial \tilde H}{\partial \eta_c}+\frac{\partial \xi_a}{\partial t}\tag{15.8}

​ 一般而言 HHH~\tilde H 不相等,我们将二者之差记为 FF ,即

H~(η,t)=H(ξ(η,t))+F(η,t)(15.9)\tilde H(\boldsymbol \eta,t)=H\left(\boldsymbol\xi(\boldsymbol\eta,t)\right)+F(\boldsymbol\eta,t)\tag{15.9}

上式对 ηc\eta_c 求偏导有

H~ηc=Hξdξdηc+Fηc(15.10)\frac{\partial\tilde H}{\partial\eta_c}=\frac{\partial H}{\partial\xi_d}\frac{\partial \xi_d}{\partial \eta_c}+\frac{\partial F}{\partial \eta_c}\tag{15.10}

代入式(15.8)有

ξaηbJbcHξdξdηc+ξaηbJbcFηc+ξat=JadHξd(15.11)\frac{\partial \xi_a}{\partial\eta_b}J_{bc}\frac{\partial H}{\partial \xi_d}\frac{\partial\xi_d}{\partial\eta_c}+\frac{\partial \xi_a}{\partial\eta_b}J_{bc}\frac{\partial F}{\partial \eta_c}+\frac{\partial\xi_a}{\partial t}=J_{ad}\frac{\partial H}{\partial \xi_d}\tag{15.11}

为了使式(15.11)对所有的 HH 都成立,我们要求

ξaηbJbcξdηc=Jad(15.12)\frac{\partial\xi_a}{\partial\eta_b}J_{bc}\frac{\partial \xi_d}{\partial \eta_c}=J_{ad}\tag{15.12}

ξaηbJbcFηc+ξat=0(15.13)\frac{\partial \xi_a}{\partial \eta_b}J_{bc}\frac{\partial F}{\partial\eta_c}+\frac{\partial \xi_a}{\partial t}=0\tag{15.13}

​ 值得强调的一点是式(15.13)中的方程确实有解。定义矩阵 M\boldsymbol M

Mab=ξaηb(15.14)\begin{aligned} M_{ab}=\frac{\partial \xi_a}{\partial \eta_b} \end{aligned}\tag{15.14}

则式(15.13)可以写为

MJFη=ξt(15.15)\boldsymbol M\boldsymbol J\frac{\partial F}{\partial \vec\eta}=\frac{\partial \vec \xi}{\partial t}\tag{15.15}

从而得到

Fη=J1M1ξt(15.16)\frac{\partial F}{\partial\vec\eta}=\boldsymbol J^{-1}\boldsymbol M^{-1}\frac{\partial \vec \xi}{\partial t}\tag{15.16}

​ 注意到式(15.16)一般而言未必有解,即对形式任意的 M\boldsymbol M ,函数 $F $ 不一定有解。该式有解的条件为(等式右边无旋)

2Fηaηd=2Fηdηa(15.17)\frac{\partial ^2F}{\partial \eta_a\partial \eta_d}=\frac{\partial^2 F}{\partial \eta_d\partial \eta_a}\tag{15.17}

ηa(Jab1Mbc1ξct)=ηa(Jdb1Mbc1ξct)(15.18)\frac{\partial}{\partial \eta_a}\left(J^{-1}_{ab}M^{-1}_{bc}\frac{\partial \xi_c}{\partial t} \right)=\frac{\partial }{\partial \eta_a}\left(J^{-1}_{db}M^{-1}_{bc}\frac{\partial \xi_c}{\partial t} \right)\tag{15.18}

实际上,可以证明若变换 ξη\vec \xi\to\vec \eta 满足式(15.12),则式(15.18)成立,进而可知式(15.13)有解。

​ 值得强调的是,式(15.12)给出的正则变换满足 detM=1|\det \boldsymbol M|=1 ,这样的正则变换称为单价正则变换。如果在推导时令 H~\tilde H'

H~(η,t)=λH(ξ(η,t),t)+F(η,t),λ0(15.19)\tilde H(\vec \eta',t)=\lambda H\left(\vec \xi(\vec \eta',t ),t\right)+F'(\vec \eta',t),\quad \lambda\neq0\tag{15.19}

式(15.12)和(15.13)变为

λξaηbJbcξdηc=Jad(15.20)\lambda \frac{\partial \xi_a}{\partial \eta_b'}J_{bc}\frac{\partial \xi_d}{\partial \eta '_c}=J_{ad}\tag{15.20}

ξaηbJbcFηc+ξat=0(15.21)\frac{\partial \xi_a}{\partial \eta'_b}J_{bc}\frac{\partial F'}{\partial \eta'_c}+\frac{\partial \xi _a}{\partial t}=0\tag{15.21}

此时 detM1|\det \boldsymbol M|\neq 1 ,相应的正则变换为非单价正则变换。

​ 对于非单价正则变换,可以令

ηa=ληaF=λF(15.22)\begin{aligned} \eta'_a=&\sqrt\lambda\eta_a\\ F'=&\lambda F \end{aligned}\tag{15.22}

且易知 H~=H~\tilde H'=\tilde H 。故非单价正则变换在相差一个常数因子的意义上与单价正则变换并无本质上的区别。通常将满足式(15.20)的变换称为在相差一个常数因子的意义上保持辛形式不变。

​ 需要注意的一点是 λ\lambda 的值不能为零。若 λ=0\lambda =0 ,则将 ξ˙a\dot\xi_aη˙a\dot \eta_a 所满足的正则方程代入两者之间的变换关系式 ξ˙a=ξaηbη˙b+ξat\dot \xi_a=\frac{\partial \xi_a}{\partial \eta_b}\dot \eta_b+\frac{\partial \xi_a}{\partial t} ,可得(此时 H~=F\tilde H=F

JadHξd=ξaηbJbcFηc+ξat(15.23)J_{ad}\frac{\partial H}{\partial \xi_d}=\frac{\partial \xi_a}{\partial \eta_b}J_{bc}\frac{\partial F}{\partial \eta_c}+\frac{\partial \xi_a}{\partial t}\tag{15.23}

JHξ=MJFξ+ξt(15.24)\boldsymbol J\frac{\partial H}{\partial \vec \xi}=\boldsymbol M\boldsymbol J\frac{\partial F}{\partial \vec\xi}+\frac{\partial \vec\xi}{\partial t}\tag{15.24}

由此可以得出

Fξ=J1M1(ξt+JHξ)(15.25)\frac{\partial F}{\partial \vec \xi}=\boldsymbol J^{-1}\boldsymbol M^{-1}\left(-\frac{\partial \vec \xi}{\partial t}+\boldsymbol J\frac{\partial H}{\partial \vec \xi} \right)\tag{15.25}

但一般而言,式(15.25)中的 FF 对任意形式的变换 ξη\xi\to\eta 无解,原因是等号右边的表达式有可能是有旋矢量场。

15.2.2 辛变换

​ 由式(15.12)

MJMT=J(15.26)\boldsymbol M\boldsymbol J\boldsymbol M^{T}=\boldsymbol J\tag{15.26}

满足式(15.26)的矩阵 M\boldsymbol M 称为辛矩阵,或辛变换。

15.2.3 泊松括号

​ 根据式(15.26),正则变换保辛形式不变。对于相空间上任意两个标量函数之间的泊松括号在正则变换下均得以保持,即无论用旧的正则变量 {q,p}\{\boldsymbol q,\boldsymbol p \} 还是新的正则变量 {Q,P}\{\boldsymbol Q,\boldsymbol P \} ,计算所得泊松括号相同。

{f,g}Q,P=fηcJcdgηd=fξaξaηcJcdξbηdgξb=fξaJabgξb={f,g}q,p(15.27)\begin{aligned} \{f,g\}_{\boldsymbol Q,\boldsymbol P}=&\frac{\partial f}{\eta_c}J_{cd}\frac{\partial g}{\partial \eta_d}\\ =&\frac{\partial f}{\partial \xi_a}\frac{\partial \xi_a}{\partial \eta_c}J_{cd}\frac{\partial \xi_b}{\partial \eta_d}\frac{\partial g}{\partial \xi_b}\\ =&\frac{\partial f}{\partial \xi_a}J_{ab}\frac{\partial g}{\partial \xi_b}=\{f,g\}_{\boldsymbol q,\boldsymbol p} \end{aligned}\tag{15.27}

15.2.4 正则变换后的哈密顿量

​ 下面我们进一步讨论如何求解正则变换后的哈密顿量 H~(η,t)=H(ξ(η,t),t)+F(η,t)\tilde H(\vec \eta,t)=H\left(\vec \xi(\vec \eta,t),t \right)+F(\vec \eta ,t) 。根据式(15.15)

Fη=J1M1ξt(15.16)\frac{\partial F}{\partial \vec \eta}=-\boldsymbol J^{-1}\boldsymbol M^{-1}\frac{\partial \vec \xi}{\partial t}\tag{15.16}

​ 首先注意到,若 ξa=ξa(η,t)\xi_a=\xi_a(\vec\eta ,t) 不显含时间,则可将 FF 取零。由此可知,对于不显含时间的正则变换,变换前后的哈密顿量相等,只需将旧的正则变量替换为新变量即可。若正则变换显含时间,则 F(η,t)F(\vec \eta,t) 可由下式确定

F(η,t)=0η(dη)TJ1M1ξ(η,t)t+G(t)(15.17)F(\vec \eta,t)=-\int_{0}^{\vec \eta}(d\vec \eta)^T\boldsymbol J^{-1}\boldsymbol M^{-1}\frac{\partial \vec \xi(\vec \eta,t)}{\partial t}+G(t)\tag{15.17}

其中 G(t)G(t) 是时间 tt 的任意函数。若式(15.16)右边矢量场无旋,则积分结果与所选取的路径无关。从而由原点到 η\vec \eta 的积分路径可以任取。

​ 最后我们指出,利用泊松括号可将上式改写为

{ξa,F}Q,P=ξa(η,t)t(15.18)\{\xi_a,F \}_{\boldsymbol Q,\boldsymbol P}=-\frac{\partial \xi_a(\vec \eta,t)}{\partial t}\tag{15.18}

由正则变换保泊松括号可知 FF 满足的方程亦可写为

{qa,F}q,p=qa(η,t)t{pa,F}q,p=pa(η,t)t(15.19)\begin{aligned} \{q_a,F \}_{q,p}=-\frac{\partial q_a(\vec \eta,t)}{\partial t}\\ \{p_a,F\}_{q,p}=-\frac{\partial p_a(\vec \eta,t)}{\partial t} \end{aligned}\tag{15.19}

Example 1 一维谐振子

​ 一维谐振子哈密顿量为

H=p22m+12mω2q2=12[(pm)2+(mωq)2]H=\frac{p^2}{2m}+\frac 12m\omega^2q^2=\frac 12\left[\left(\frac{p}{\sqrt m} \right)^2+(\sqrt m\omega q)^2\right]

自然地,可考虑将 (p/m,mωq)(p/\sqrt m,\sqrt m\omega q) 转为极坐标,即

pm=f(I)cosθmωq=f(I)sinθ\begin{aligned} \frac p{\sqrt m}=&f(I)\cos\theta\\ \sqrt m\omega q=&f(I)\sin\theta \end{aligned}

下面我们计算出能使 (q,p)(θ,I)(q,p)\to(\theta,I) 为正则变换的函数 f(I)f(I)

​ 由于泊松括号反对称,易知下式自动成立

{q,q}θ,I={p,p}θ,I=0\{q,q\}_{\theta,I}=\{p,p\}_{\theta,I}=0

{q,p}θ,I=qθpIqIpθ=f(I)f(I)ωcos2θ+f(I)f(I)ωsin2θ=f(I)f(I)ω\begin{aligned} \{q,p\}_{\theta,I}=&\frac{\partial q}{\partial \theta}\frac{\partial p}{\partial I}-\frac{\partial q}{\partial I}\frac{\partial p}{\partial \theta}\\ =&\frac{f(I)f'(I)}{\omega}\cos^2\theta+\frac{f(I)f'(I)}\omega\sin^2\theta\\ =&\frac{f(I)f'(I)}\omega \end{aligned}

故要求

f(I)f(I)ω=12ωd[f(I)]2dI=1\frac{f(I)f'(I)}\omega=\frac 1{2\omega}\frac{\mathrm d[f(I)]^2}{\mathrm dI}=1

[f(I)]2=2ωI+c[f(I)]^2=2\omega I+c

c=0c=0 ,有

q=2Imωsinθp=2mωIcosθ\begin{aligned} q=&\sqrt{\frac{2I}{m\omega}}\sin\theta\\ p=&\sqrt{2m\omega I}\cos\theta \end{aligned}

由于正则变换式不显含时间,故 H~=H\tilde H=H,即

H~(θ,I)=H(q(θ,I),p(θ,I))=ωI\tilde H(\theta,I)=H\left(q(\theta,I),p(\theta,I)\right)=\omega I

用新正则变量 θ,I\theta,I 表达的正则方程为

θ˙=H~I=ωI˙=H~θ=0\begin{aligned} \dot \theta=&\frac{\partial \tilde H}{\partial I}=\omega\\ \dot I=&-\frac{\partial \tilde H}{\partial \theta}=0 \end{aligned}

这组方程容易求解,结果为

θ=θ0+ωtI=Eω\begin{aligned} \theta=&\theta_0+\omega t\\ I=&\frac{E}{\omega} \end{aligned}

从而 q(t)q(t)p(t)p(t) 的解为

q(t)=2E/mω2sin(θ0+ωt)p(t)=2mEcos(θ0+ωt)\begin{aligned} q(t)=&\sqrt{2E/m\omega^2}\sin(\theta_0+\omega t)\\ p(t)=&\sqrt{2mE}\cos(\theta_0+\omega t) \end{aligned}

Example 2 规范变换

​ 带电粒子在电磁场中运动的拉氏量为

L=12r˙2+qAr˙qϕL=\frac 12\dot{\boldsymbol r}^2+q\boldsymbol A\cdot\dot{\boldsymbol r}-q\phi

我们曾证明,在规范变化

ϕ=ϕ1qftA=A+1qf\begin{aligned} \phi'=&\phi'-\frac{1}{q}\frac{\partial f}{\partial t}\\ A'=&A+\frac{1}{q}\nabla f \end{aligned}

下,拉氏量变为

L=L+dfdtL'=L+\frac{\mathrm df}{\mathrm dt}

注意到规范变换后,正则动量变为

p=Lr˙=Lr˙+r˙(dfdt)=p+f\begin{aligned} \boldsymbol p'=&\frac{\partial L'}{\partial \dot{\boldsymbol r}'} =\frac{\partial L}{\partial \dot{\boldsymbol r}}+\frac{\partial }{\partial\dot{\boldsymbol r}}\left(\frac{\mathrm df}{\mathrm dt} \right)\\ =&\boldsymbol p+\nabla f \end{aligned}

因此规范变换给出了下述变换

r=rp=p+f\begin{aligned} \boldsymbol r'=&\boldsymbol r\\ \boldsymbol p'=&\boldsymbol p+\nabla f \end{aligned}

注意到上式给出的是正则变换,为此需要验证变换保泊松括号不变,易见

{ra,rb}=0{ra,pb}=δab{pa,rb}=δab\begin{aligned} \{r'_a,r'_b\}=&0\\ \{r'_a,p'_b\}=&\delta_{ab}\\ \{p'_a,r'_b\}=&-\delta_{ab}\\ \end{aligned}

以及

{pa,pb}={pa+fra,pb+frb}={frapb}+{pa,frb}=2frarb2frbra=0\begin{aligned} \{p'_a,p'_b\}=&\{p_a+\frac{\partial f}{\partial r_a},p_b+\frac{\partial f}{\partial r_b} \} \\ =&\{\frac{\partial f}{\partial r_a},p_b\}+\{p_a,\frac{\partial f}{\partial r_b}\}\\ =&\frac{\partial^2f}{\partial r_a\partial r_b}-\frac{\partial ^2f}{\partial r_b\partial r_a}=0 \end{aligned}

​ 下面我们来求函数 FF ,进而求得变换后的哈密顿量 H~=H+F\tilde H=H+F,先解出逆变换

r=rp=prf(r,t)=prf(r,t)\begin{aligned} \boldsymbol r=&\boldsymbol r'\\ \boldsymbol p=&\boldsymbol p'-\nabla_{\boldsymbol r}f(\boldsymbol r,t)\\ =&\boldsymbol p'-\nabla_{\boldsymbol r'}f(\boldsymbol r',t) \end{aligned}

​ 根据式(15.19),有

{r,F}=r(r,p,t)t=0{p,F}=p(r,p,t)t=rf(r,t)tr=2ftr\begin{aligned} \{\boldsymbol r,F\}=&-\frac{\partial \boldsymbol r(\boldsymbol r',\boldsymbol p',t)}{\partial t}=0\\ \{\boldsymbol p,F\}=&-\frac{\partial \boldsymbol p(\boldsymbol r',\boldsymbol p',t)}{\partial t}\\ =&\frac{\partial \nabla_{\boldsymbol r'}f(\boldsymbol r,t)}{\partial t'\partial \boldsymbol r'}=\frac{\partial^2f}{\partial t\partial\boldsymbol r} \end{aligned}

进而得到

Fp=0Fr=2ftr\begin{aligned} \frac{\partial F}{\partial \boldsymbol p}=&0\\ \frac{\partial F}{\partial \boldsymbol r}=&-\frac{\partial ^2f}{\partial t\partial \boldsymbol r} \end{aligned}

解的

F=ftF=-\frac{\partial f}{\partial t}

​ 综上,变换后的哈密顿量为

H~(r,p,t)=H(r,p,t)+F(r,p,t)=(pqA)22m+qϕft=(pfqA)22m+qϕft=(pqA)22m+qϕ\begin{aligned} \tilde H(\boldsymbol r',\boldsymbol p',t)=&H(\boldsymbol r,\boldsymbol p,t)+F(\boldsymbol r',\boldsymbol p',t)\\ =&\frac{(\boldsymbol p-q\boldsymbol A)^2}{2m}+q\phi-\frac{\partial f}{\partial t}\\ =&\frac{(\boldsymbol p'-\nabla f-q\boldsymbol A)^2}{2m}+q\phi-\frac{\partial f}{\partial t}\\ =&\frac{(\boldsymbol p-q\boldsymbol A')^2}{2m}+q\phi' \end{aligned}

与我们预期的规范变换一致。

15.1 相空间的坐标变换

​ 哈密顿力学中广义坐标和广义动量被置于平等的地位,并统一作为相空间的坐标 {ξ}\{\boldsymbol\xi\} 。很自然地考虑相空间中的坐标变换

ξαηα(ξ,t),α=1,,2s(15.1)\xi^\alpha\to\eta^\alpha(\boldsymbol\xi,t),\quad \alpha=1,\cdots,2s\tag{15.1}

相较于对 ss 个广义坐标的变换,对 2s2s 个相空间坐标的变换式大大拓展了变换的形式。但是,并不是随便一个相空间的坐标变换都有物理上的重要性。在位形空间的广义坐标变换下,拉格朗日方程的形式是不变的,相应的哈密顿正则方程的形式也是不变的。因此,有很大的任意性选择位形空间坐标变换的形式。但是,在任意相空间坐标变换式下,哈密顿正则方程式变化的。这就给问题带来了额外的复杂性。因此,我们希望寻找某一类特殊的相空间坐标变换,使得变换下哈密顿正则方程形式不变。从几何的角度,哈密顿正则方程的形式来源于相空间的反对称几何结构——辛矩阵,因此问题归结于保证这种几何结构不变,亦即辛矩阵形式不变的相空间坐标变换。

15.2 保辛与正则变换

​ 考虑相空间中的任意坐标

ξαηα=ηα(t,ξ),α=1,,2s(15.2)\xi^{\alpha}\to\eta^{\alpha}=\eta^{\alpha}(t,\boldsymbol\xi),\quad \alpha=1,\cdots,2s\tag{15.2}

在变换式(15.2)下,泊松括号变为

 [f,g]ξ=ωρσfξρgξσ=ωρσ(fηαηαξρ)(gηβηβξσ)=(ωρσηαξρηβξσ)fηαgηβ(15.3)\begin{aligned} \ [f,g]_\xi=&\omega^{\rho\sigma}\frac{\partial f}{\partial \xi^{\rho}}\frac{\partial g}{\partial \xi^\sigma}=\omega^{\rho\sigma}\left(\frac{\partial f}{\partial \eta^\alpha}\frac{\partial \eta^{\alpha}}{\partial \xi^\rho} \right)\left(\frac{\partial g}{\partial \eta^\beta}\frac{\partial \eta^\beta}{\partial \xi^\sigma} \right)\\ =&\left(\omega^{\rho\sigma}\frac{\partial \eta^\alpha}{\partial \xi^\rho}\frac{\partial \eta^\beta}{\partial \xi^\sigma} \right)\frac{\partial f}{\partial\eta^\alpha}\frac{\partial g}{\partial \eta^\beta} \end{aligned}\tag{15.3}

为了使得变换前后辛矩阵形式不变,从而自动保证泊松括号也不变,这即要求

ωρσηαξρηβξσ=ωαβ    ωαβξρηαξσηβ=ωρσ(15.4)\omega^{\rho\sigma}\frac{\partial \eta^\alpha}{\partial \xi^\rho}\frac{\partial \eta^\beta}{\partial \xi^\sigma}=\omega^{\alpha\beta}\quad \iff\quad \omega^{\alpha\beta}\frac{\partial \xi^\rho}{\partial \eta^\alpha}\frac{\partial \xi^\sigma}{\partial \eta^\beta}=\omega^{\rho\sigma} \tag{15.4}

满足这样条件的相空间坐标变换即被称为正则变换(canonical transformation)。

​ 欧氏、闵氏空间中的转动保证了“距离”不变,而相空间中的正则变换保证了相空间中的任意面积不变。从这个意义上,正则变换可以形象地视为相空间的“流动”。

​ 相空间坐标变换的雅可比矩阵记为

ηαξβ=Mα ⁣β    ξαηβ=(M1)α ⁣β(15.5)\frac{\partial \eta^\alpha}{\partial \xi^\beta}=M^\alpha\!_\beta\quad \iff \quad \frac{\partial \xi^\alpha}{\partial \eta^\beta}=\left(\boldsymbol M^{-1}\right)^{\alpha}\!_{\beta}\tag{15.5}

则正则变换条件式(15.4)可以写成

ωρσMα ⁣ρMβ ⁣σ=ωαβ    ωρσMρ ⁣αMσ ⁣β=ωαβ(15.6)\omega^{\rho\sigma}M^{\alpha}\!_{\rho}M^{\beta}\!_\sigma=\omega^{\alpha\beta}\quad \iff\quad \omega_{\rho\sigma}M^\rho\!_\alpha M^{\sigma}\!_\beta=\omega_{\alpha\beta}\tag{15.6}

满足这样条件的矩阵 M\boldsymbol M 一般统称为辛矩阵(symplectic matrix)。式(15.6)用矩阵形式写成

Mω1MT=ω1    MTωM=ω(15.7)\boldsymbol M\omega^{-1}\boldsymbol M^T=\omega^{-1}\quad \iff\quad \boldsymbol M^T\omega\boldsymbol M=\omega \tag{15.7}

​ 从保证基本的几何结构——度规或辛矩阵不变的角度,在数学形式上正则变换似乎和欧氏、闵氏空间中的转动没什么不同。但是,正则变换和转动有一个重要的区别,欧氏、闵氏空间中的转动是线性变换,但是正则变换一般是非线性变换。数学上这是因为相较于“对称”的度规,“反对称”的辛矩阵给了正则变换更大的自由。形象地说,这是因为正则变换并不保证“距离”不变(相空间并没有定义距离),而只是保证“面积”不变,因此作为“流动”的正则变换当然就可以是非线性的。

15.2.2 点变换是正则变换

​ 此前我们熟悉的是位形空间的广义坐标变换

qaQa=Qa(t,q),a=1,,s(15.8)q^a\to Q^a=Q^a(t,\boldsymbol q),\quad a=1,\cdots,s\tag{15.8}

也被称作点变换。一个问题是,正则变换和点变换有什么关系?这里的关键在于,广义坐标的点变换必然诱导出广义动量的变换。首先,变换式(15.9)可逆,即存在 qa=qa(t,Q)q^a=q^a(t,\boldsymbol Q) ,对时间求导得到

q˙a=qat+qaQbQ˙b(15.9)\dot q^a=\frac{\partial q^a}{\partial t}+\frac{\partial q^a}{\partial Q^b}\dot Q^b\tag{15.9}

由上式得到新、旧广义速度之间的偏导数关系

q˙aQ˙b=qaQb(15.10)\frac{\partial \dot q^a}{\partial \dot Q^b}=\frac{\partial q^a}{\partial Q^b}\tag{15.10}

拉格朗日量在点变换下是不变的,即 L(t,q,q˙)=L~(t,Q,Q˙)L(t,\boldsymbol q,\dot{\boldsymbol q})=\tilde L(t,\boldsymbol Q,\dot{\boldsymbol Q}) 。因此新广义坐标 QaQ^a 的共轭动量为

PaL~Q˙a=LQ˙a=LqbqbQ˙a+Lq˙bq˙bQ˙a=pbqbQa(15.11)P_a\equiv\frac{\partial \tilde L}{\partial \dot Q^a}=\frac{\partial L}{\partial \dot Q^a}=\frac{\partial L}{\partial q^b}\frac{\partial q^b}{\partial \dot Q^a}+\frac{\partial L}{\partial \dot q^b}\frac{\partial \dot q^b}{\partial \dot Q^a}=p_b\frac{\partial q^b}{\partial Q^a}\tag{15.11}

因此,点变换式(15.8)诱导出的相空间坐标变换为

{qa,pb}{Qa,Pb}={Qa(t,q),qbQa(t,q)pb}(15.12)\{q^a,p_b\}\to\{Q^a,P_b \}=\left\{Q^a(t,\boldsymbol q),\frac{\partial q^b}{\partial Q^a}(t,\boldsymbol q)p_b \right\}\tag{15.12}

​ 为了验证变换式(15.12)是否是正则变换,只需要验证新的相空间坐标 {Q,P}\{\boldsymbol Q,\boldsymbol P\} 是否满足基本泊松括号。容易得到

[Qa,Qb]=0[Q^a,Q^b]=0

 [Pa,Pb]=[qaQapa,qbQbpb]=paqbQb[qaQa,pb]+pbqaQa[pa,qbQb]=paqbQbqb(qaQa)pbqaQaqa(qbQb)=2qaQaQbpa2qbQaQbpb=0\begin{aligned} \ [P_a,P_b]=&\left[\frac{\partial q^{a'}}{\partial Q^a}p_{a'},\frac{\partial q^{b'}}{\partial Q^b}p_{b'} \right]=p_{a'}\frac{\partial q^{b'}}{\partial Q^b}\left[\frac{\partial q^{a'}}{\partial Q^a},p_{b'} \right]+p_{b'}\frac{\partial q^{a'}}{\partial Q^a}\left[p_{a'},\frac{\partial q^{b'}}{\partial Q^b} \right]\\ =&p_{a'}\frac{\partial q^{b'}}{\partial Q^b}\frac{\partial }{\partial q^{b'}}\left(\frac{\partial q^{a'}}{\partial Q^a} \right)-p_{b'}\frac{\partial q^{a'}}{\partial Q^a}\frac{\partial }{\partial q^{a'}}\left(\frac{\partial q^{b'}}{\partial Q^b} \right)\\ =&\frac{\partial ^2q^{a'}}{\partial Q^a\partial Q^b}p_{a'}-\frac{\partial^2 q^{b'}}{\partial Q^a\partial Q^b}p_{b'}=0 \end{aligned}

以及

[Qa,Pb]=[Qa,qcQbpc]=[Qa,pc]qcQb=QaqcqcQb=δba[Q^a,P_b]=\left[Q^a,\frac{\partial q^c}{\partial Q^b}p_c \right]=[Q^a,p_c]\frac{\partial q^c}{\partial Q^b}=\frac{\partial Q^a}{\partial q^c}\frac{\partial q^c}{\partial Q^b}=\delta^a_b

因此点变换(所诱导的相空间坐标变换)都是正则变换。换句话说,位形空间中的点变换是相空间中的正则变换的特例。反过来,因为正则变换的存在,大大拓展了在相空间中做“变换”的方式,得以从更多角度分析系统的演化。

15.3 生成函数

15.3.1 正则变换的生成函数

​ 在相空间坐标 {q,p}\{\boldsymbol q,\boldsymbol p\} 下,系统的哈密顿量为 H=H(t,q,p)H=H(t,\boldsymbol q,\boldsymbol p) ,哈密顿正则方程为

q˙a=Hpa,p˙a=Hqa,a=1,,s(15.13)\dot q^a=\frac{\partial H}{\partial p^a},\quad \dot p_a=-\frac{\partial H}{\partial q^a},\quad a=1,\cdots,s\tag{15.13}

经过正则变换,新的相空间坐标为 {Q,P}\{\boldsymbol Q,\boldsymbol P\} ,满足同样形式的哈密顿正则方程

Q˙a=KPa,P˙a=KQa,a=1,,s(15.14)\dot Q^a=\frac{\partial K}{\partial P_a},\quad \dot P_a=-\frac{\partial K}{\partial Q^a},\quad a=1,\cdots,s\tag{15.14}

这里 K=K(t,Q,P)K=K(t,\boldsymbol Q,\boldsymbol P) 是变换后的哈密顿量。

​ 从相空间的变分原理出发,式(15.13)对应

δS[q,p]=dtδ[paq˙aH(t,q,p)]=0(15.15)\delta S[\boldsymbol q,\boldsymbol p]=\int\mathrm dt\delta[p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)]=0\tag{15.15}

而式(15.14)对应

δS~[Q,P]=dtδ[PaQ˙aK(t,Q,P)]=0(15.16)\delta \tilde S[\boldsymbol Q,\boldsymbol P]=\int\mathrm dt\delta\left[P_a\dot Q^a-K(t,\boldsymbol Q,\boldsymbol P) \right]=0\tag{15.16}

要求式(15.14)和(15.14)同时成立,意味着作用量 SS 取极值,则作用量 S~\tilde S 也取极值,这意味着

paq˙aH(t,q,p)=PaQ˙aK(t,Q,P)+dFdt(15.17)p_a\dot q^a-H(t,\boldsymbol q,\boldsymbol p)=P_a\dot Q^a-K(t,\boldsymbol Q,\boldsymbol P)+\frac{\mathrm dF}{\mathrm dt}\tag{15.17}

因此,如果新、旧坐标 {q,p}\{\boldsymbol q,\boldsymbol p\}{Q,P}\{\boldsymbol Q,\boldsymbol P\} 是正则变换关系,则满足式(15.12),其中包含一个函数 FF ,其函数形式取决于具体的正则变换关系。

​ 现在的问题是,FF 是谁的函数?为此,我们将式(15.17)改写成微分式

dF=padqaPadQa+[K(t,Q,P)H(t,q,p)]dt(15.18)\mathrm dF=p_a\mathrm dq^a-P_a\mathrm dQ^a+\left[K(t,\boldsymbol Q,\boldsymbol P)-H(t,\boldsymbol q,\boldsymbol p)\right]\mathrm dt\tag{15.18}

式(15.18)的意义可以从两个方面理解。首先,其表明如果变换是正则变换,等式右边的微分组合必须是个“全微分”。特别是,对于固定时间 tt ,有

paδqaPaδQa=δF(15.19)p_a\delta q^a-P_a\delta Q^a=\delta F \tag{15.19}

这实际上也给出了判断正则变换的另一种方法。其次,FF 的函数关系由式(15.18)也一目了然。如果 2s2s 个新、旧广义坐标 {q,Q}\{\boldsymbol q,\boldsymbol Q\} 是独立的,则式(15.18)意味着 FF 是新、旧广义坐标 {q,Q}\{\boldsymbol q,\boldsymbol Q\} 以及时间 tt 的函数,即有

F=F(t,q,Q)(15.20)F=F(t,\boldsymbol q,\boldsymbol Q)\tag{15.20}

且偏导数关系可以直接读出

F(t,q,Q)qa=pa,F(t,q,Q)Qa=Pa,a=1,,s(15.21)\frac{\partial F(t,\boldsymbol q,\boldsymbol Q)}{\partial q^a}=p_a,\quad \frac{\partial F(t,\boldsymbol q,\boldsymbol Q)}{\partial Q^a}=-P_a,\quad a=1,\cdots,s\tag{15.21}

F(t,q,Q)t=K(t,Q,P)H(t,q,p)(15.22)\frac{\partial F(t,\boldsymbol q,\boldsymbol Q)}{\partial t}=K(t,\boldsymbol Q,\boldsymbol P)-H(t,\boldsymbol q,\boldsymbol p)\tag{15.22}

​ 式(15.21)给出了新、旧相空间坐标 {q,p}\{\boldsymbol q,\boldsymbol p\}{Q,P}\{\boldsymbol Q,\boldsymbol P\} 之间的 2s2s 个方程。由隐函数关系,当且仅当 det(2FqaQb)0\det\left(\frac{\partial^2F}{\partial q^a\partial Q^b} \right)\neq 0 时,可以从式(15.21)的两个方程中反解出全部 2s2s 个新相空间坐标作为旧相空间坐标的函数

Qa=Qa(t,q,p),Pa=Pa(t,q,P),a=1,,s(15.23)Q^a=Q^a(t,\boldsymbol q,\boldsymbol p),\quad P_a=P_a(t,\boldsymbol q,\boldsymbol P),\quad a=1,\cdots,s\tag{15.23}

即给出了完整的正则变换。其次,式(15.22)则给出了新、旧哈密顿量之间的关系

K(t,Q,P)=H(t,q,p)+F(t,q,Q)t(15.24)K(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p)+\frac{\partial F(t,\boldsymbol q,\boldsymbol Q)}{\partial t}\tag{15.24}

由之可见,正则变换下新、旧哈密顿量的区别 Ft\frac{\partial F}{\partial t} 完全由正则变换本身决定,而与新、旧哈密顿量的具体形式无关。这也正体现了正则变换的“几何”属性——即只是相空间的一种坐标变换,而与具体的物理系统无关。函数 $F $ 被称为正则变换的生成函数(generating function)。

​ 从量纲的角度,因为拉格朗日量和哈密顿量都具有能量量纲,因此式(15.18)表明生成函数 FF 也有固定的量纲,且就是作用量的量纲。同时,式(15.18)也意味着,在正则变换下,广义坐标及其共轭动量本身未必具有“长度”和“动量”的量纲,但是作为共轭变量对,其量纲的乘积一定是作用量的量纲。总之,

[正则坐标][正则动量]=[生成函数]=[作用量][正则坐标]\cdot[正则动量]=[生成函数]=[作用量]

15.3.2 生成函数的 4 种基本类型

​ 自由度为 ss 的系统的相空间为 2s2s 维,因此同为系统状态的描述,2s2s 个旧相空间坐标和 2s2s 个新相空间坐标这 4s4s 个变量中,只有 2s2s 个是独立的。从生成函数的角度,其需要在新、旧变量之间建立联系,因此这 2s2s 个独立变量总是取为 ss 个旧变量和 ss 个新变量。从式(15.18)出发确定的生成函数 F(t,q,Q)F(t,\boldsymbol q,\boldsymbol Q)ss 个旧广义坐标和 ss 个新广义坐标的函数,但 {q,Q}\{\boldsymbol q,\boldsymbol Q\} 并不总是相互独立。因此,由必要讨论其他形式的生成函数。因为生成函数总是涉及新、旧变量,同时又涉及广义坐标和广义动量的不同,因此就存在 4 种基本类型。这些基本类型之间是通过勒让德变换联系起来的。

​ 我们将由式(15.18)确定的生成函数 F(t,q,Q)F(t,\boldsymbol q,\boldsymbol Q) 称作第 1 型生成函数

F(t,q,Q)=F1(t,q,Q)(15.25)F(t,\boldsymbol q,\boldsymbol Q)=F_1(t,\boldsymbol q,\boldsymbol Q)\tag{15.25}

其是 2s2s 个新、旧广义坐标 {q,Q}\{\boldsymbol q,\boldsymbol Q\} 以及时间 tt 的函数。正则变换关系为

pa=F1(t,q,Q)qa,Pa=F1(t,q,Q)Qa,a=1,,s(15.26)p_a=\frac{\partial F_1(t,\boldsymbol q,\boldsymbol Q)}{\partial q^a},\quad P_a=-\frac{\partial F_1(t,\boldsymbol q,\boldsymbol Q)}{\partial Q^a},\quad a=1,\cdots,s\tag{15.26}

新、旧哈密顿量之间的关系为

K(t,Q,P)=H(t,q,p)+F1(t,q,Q)t(15.27)K(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p)+\frac{\partial F_1(t,\boldsymbol q,\boldsymbol Q)}{\partial t}\tag{15.27}

注意,正则变换式(15.26)可逆,要求生成函数的黑塞矩阵非退化,即 det(2F1qaQb)0\det\left(\frac{\partial ^2F_1}{\partial q^a\partial Q^b} \right)\neq 0

​ 由勒让德变换,可以得到其他类型的生成函数。将式(15.18)改写为

d(F1+QaPa)=padqa+QadPa+(KH)dt(15.28)\mathrm d(F_1+Q^aP_a)=p_a\mathrm dq^a+Q^a\mathrm dP_a+(K-H)\mathrm dt\tag{15.28}

因此,若以 {q,P}\{\boldsymbol q,\boldsymbol P\}2s2s 个独立变量,根据式(15.28)的形式,定义

F2(t,q,P)=F1(t,q,Q)+QaPa(15.29)F_2(t,\boldsymbol q,\boldsymbol P)=F_1(t,\boldsymbol q,\boldsymbol Q)+Q^aP_a\tag{15.29}

其是 ss 个旧广义坐标 {q}\{\boldsymbol q\}ss 个新广义动量 {P}\{\boldsymbol P\} 的函数,被称作第 2 型生成函数。式(15.29)表明, F2F_2 实际就是通过勒让德变换,将 F1F_1 中的新广义坐标 {Q}\{Q\} 换成新广义动量 {P}\{\boldsymbol P\} 的结果。微分式(15.28)直接给出偏导数关系,即正则变换

pa=F2(t,q,P)qa,Qa=F2(t,q,P)Pa,a=1,,s(15.30)p_a=\frac{\partial F_2(t,\boldsymbol q,\boldsymbol P)}{\partial q^a},\quad Q^a=\frac{\partial F_2(t,\boldsymbol q,\boldsymbol P)}{\partial P_a},\quad a=1,\cdots,s\tag{15.30}

以及新、旧哈密顿量之间的关系

K(t,Q,P)=H(t,q,p)+F2t(15.31)K(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p)+\frac{\partial F_2}{\partial t}\tag{15.31}

同样正则变换要求 det(2FqaPb)0\det\left(\frac{\partial ^2 F}{\partial q^a\partial P_b}\right)\neq 0

​ 类似得有,第 3 型生成函数

d(F1paqa)=qadpaPadQa+(KH)dt(15.32)\mathrm d(F_1-p_aq^a)=-q^a\mathrm dp_a-P_a\mathrm dQ^a+(K-H)\mathrm dt\tag{15.32}

定义

F3(t,p,Q)=F1(t,q,Q)paqa(15.33)F_3(t,\boldsymbol p,\boldsymbol Q)=F_1(t,\boldsymbol q,\boldsymbol Q)-p_aq^a\tag{15.33}

有偏导数关系,即正则变换

qa=F3(t,p,Q)pa,Pa=F3(t,p,Q)Qa,a=1,,s(15.34)q^a=-\frac{\partial F_3(t,\boldsymbol p,\boldsymbol Q)}{\partial p_a},\quad P_a=-\frac{\partial F_3(t,\boldsymbol p,\boldsymbol Q)}{\partial Q^a},\quad a=1,\cdots,s\tag{15.34}

以及新、旧哈密顿量之间的关系

K(t,Q,P)=H(t,q,p)+F3(t,p,Q)t(15.35)K(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p)+\frac{\partial F_3(t,\boldsymbol p,\boldsymbol Q)}{\partial t}\tag{15.35}

同样,正则变换式可逆要求 det(2F3paQb)0\det\left(\frac{\partial ^2 F_3}{\partial p_a\partial Q^b}\right)\neq 0

​ 第 4 型生成函数

d(F1+PaQapaqa)=qadpa+QadPa+(KH)dt(15.36)\mathrm d(F_1+P_aQ^a-p_aq^a)=-q^a\mathrm dp_a+Q^a\mathrm dP_a+(K-H)\mathrm dt\tag{15.36}

定义

F4(t,p,P)=F1+PaQapaqa(15.37)F_4(t,\boldsymbol p,\boldsymbol P)=F_1+P_aQ^a-p_aq^a\tag{15.37}

有偏导数关系,即正则变换

qa=F4(t,p,P)pa,Qa=F4(t,p,Q)Pa,a=1,,s(15.38)q^a=-\frac{\partial F_4(t,\boldsymbol p,\boldsymbol P)}{\partial p_a},\quad Q^a=\frac{\partial F_4(t,\boldsymbol p,\boldsymbol Q)}{\partial P_a},\quad a=1,\cdots,s\tag{15.38}

以及新、旧哈密顿量之间的关系

K(t,Q,P)=H(t,q,p)+F4(t,p,P)t(15.39)K(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p)+\frac{\partial F_4(t,\boldsymbol p,\boldsymbol P)}{\partial t}\tag{15.39}

同样,正则变换式可逆要求 det(2F4paPa)0\det\left(\frac{\partial ^2F_4}{\partial p^a\partial P_a}\right)\neq 0

Example 15.4 恒等变换

​ 考虑第 2 型生成函数

F2=qaPaF_2=q^aP_a

可以得到

pa=F2qa=Pa,Qa=F2Pa=qa,a=1,,sp_a=\frac{\partial F_2}{\partial q^a}=P_a,\quad Q^a=\frac{\partial F_2}{\partial P_a}=q^a,\quad a=1,\cdots,s

即新、旧相空间坐标全等。因为生成函数不显含时间,因此 K(t,Q,P)=H(t,q,p)K(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p) 。所以生成函数 F2=qaPaF_2=q^aP_a 生成“恒等变换”(identity transformation)。同理,还可以考虑第 3 型生成函数

F3=paQaF_3=p_aQ^a

Example 15.5 平移变换

​ 在恒等变换的基础上,考虑第 2 型生成函数

F2=qaPa+λaPa+μaqaF_2=q^aP_a+\lambda^aP_a+\mu_aq^a

其中 λa\lambda^aμa\mu_a2s2s 个常数。有

pa=F2qa=Pa+μa,Qa=F2Pa=qa+λa,a=1,,sp_a=\frac{\partial F_2}{\partial q^a}=P_a+\mu_a,\quad Q^a=\frac{\partial F_2}{\partial P_a}=q^a+\lambda^a,\quad a=1,\cdots,s

以及 K(t,Q,P)=H(t,q,p)K(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p) 。可见,这个变换对应坐标的和动量的整体平移。

Example 15.6 点变换

​ 考虑第 2 型生成函数

F2=fa(t,q)PaF_2=f^a(t,\boldsymbol q)P_a

这里 fa(t,q)f^a(t,\boldsymbol q){q}\{\boldsymbol q\} 的任意 ss 个独立且可逆的函数。有

pa=F2qa=fb(t,q)qaPb,Qa=F2Pa=fa(t,q),a=1,,sp_a=\frac{\partial F_2}{\partial q^a}=\frac{\partial f^b(t,\boldsymbol q)}{\partial q^a}P_b,\quad Q^a=\frac{\partial F_2}{\partial P_a}=f^a(t,\boldsymbol q),\quad a=1,\cdots,s

以及 K(t,Q,P)=H(t,q,p)+fa(t,q)tPaK(t,\boldsymbol Q,\boldsymbol P)=H(t,\boldsymbol q,\boldsymbol p)+\frac{\partial f^a(t,\boldsymbol q)}{\partial t}P_a。上式正是广义坐标的点变换以及点变换所诱导的广义动量的变换。

15.4 单参数正则变换

15.4.1 无穷小正则变换

​ 考虑相空间坐标的无穷小变换

ξαξα+ϵXα(ξ),α=1,,2s(15.40)\xi^\alpha\to\xi^\alpha+\epsilon X^\alpha(\boldsymbol \xi),\quad \alpha=1,\cdots,2s\tag{15.40}

这里 ϵ\epsilon 为无穷小参数(与相空间坐标无关),Xa=Xa(ξ)X^a=X^a(\boldsymbol \xi)2s2s 个相空间坐标的函数,可以视为相空间中的矢量场。根据正则变换的保泊松括号,有

 [ξα+ϵXα,ξβ+ϵXβ]=[ξα,ξβ]+ϵ[ξα,Xβ]+ϵ[Xα,ξβ]=ωαβ+ϵ(ωαρXβξρωβρXαξρ)(15.41)\begin{aligned} \ [\xi^\alpha+\epsilon X^\alpha,\xi^\beta+\epsilon X^\beta]=&[\xi^\alpha,\xi^\beta]+\epsilon[\xi^\alpha,X^\beta]+\epsilon[X^\alpha,\xi^\beta]\\ =&\omega^{\alpha\beta}+\epsilon\left(\omega^{\alpha\rho}\frac{\partial X^\beta}{\partial \xi^\rho}-\omega^{\beta\rho}\frac{\partial X^\alpha}{\partial \xi^\rho} \right) \end{aligned}\tag{15.41}

其中只保留 ϵ\epsilon 的线性阶。因此,变换式(15.41)是正则变换当且仅当上式最后一项为零,即 Xα(ξ)X^\alpha(\boldsymbol\xi) 满足

ωαρXβξρ=ωβρXαξρ(15.42)\omega^{\alpha\rho}\frac{\partial X^\beta}{\partial \xi^\rho}=\omega^{\beta\rho}\frac{\partial X^\alpha}{\partial \xi^\rho}\tag{15.42}

其是关于 2s2s 个函数 Xα(ξ)X^\alpha(\boldsymbol\xi) 的偏微分方程组。若将广义坐标和广义动量分别写出,记式(15.40)为 qaqa+ϵuaq^a\to q^a+\epsilon u^apapa+ϵvap_a\to p_a+\epsilon v_a ,利用同样的方法可以给出 uau^avav_a 所满足的条件

ubpa=uapb,vbqa=vaqb,uaqb=vbpa(15.43)\frac{\partial u^b}{\partial p_a}=\frac{\partial u^a}{\partial p_b},\quad \frac{\partial v_b}{\partial q^a}=\frac{\partial v_a}{\partial q^b},\quad \frac{\partial u^a}{\partial q^b}=-\frac{\partial v_b}{\partial p_a}\tag{15.43}

其与判断方程为哈密顿正则方程的条件式形式完全一致。

​ 虽然条件式(15.42)看上去复杂,但是可以验证,当 XaX^a 由相空间上函数 G(t,ξ)G(t,\boldsymbol \xi) 的梯度给出且具有

XαωαβGξβ(15.44)X^\alpha\equiv\omega^{\alpha\beta}\frac{\partial G}{\partial \xi^\beta}\tag{15.44}

的形式时

ωαρXβξρωβρXαξρ=(ωαρωβσωβρωασ)2Gξρξσ0\omega^{\alpha\rho}\frac{\partial X^\beta}{\partial \xi^\rho}-\omega^{\beta\rho}\frac{\partial X^\alpha}{\partial \xi^\rho}=(\omega^{\alpha\rho}\omega^{\beta\sigma}-\omega^{\beta\rho}\omega^{\alpha\sigma})\frac{\partial ^2G}{\partial \xi^\rho\partial \xi^\sigma}\equiv 0

即满足式(15.42)。式(15.44)可以用泊松括号写成

XGα:=ωαβGξβ=[ξα,G](15.45)X^\alpha_G:=\omega^{\alpha\beta}\frac{\partial G}{\partial \xi^\beta}=[\xi^\alpha,G]\tag{15.45}

其是相空间中的矢量场,被称作 GG 的哈密顿矢量场。

​ 总之,给定相空间上函数 G(t,ξ)G(t,\boldsymbol \xi) ,便得到一个无穷小正则变换(infinitesimal canonical transformation),

ξαξα+δξα(15.46)\xi^\alpha\to\xi^\alpha+\delta\xi^\alpha\tag{15.46}

其中

δξα=ϵ[ξα,G]ϵXα(15.47)\delta \xi^\alpha=\epsilon[\xi^\alpha,G]\equiv\epsilon X^\alpha\tag{15.47}

ϵ\epsilon 为无穷小参数。因为无穷小正则变换由函数 G(t,ξ)G(t,\boldsymbol\xi) 所生成,GG 即被称作无穷小正则变换的生成元。

​ 无穷小正则变换的生成元与 15.3 节讨论的生成函数是得到正则变换的两种不同方法。同为相空间上的函数,生成元 GG 以式(15.47)的形式生成无穷小正则变换;而生成函数 FF 满足全微分条件式(15.18),并以 15.3 节给出的偏导数关系生成正则变换(可以是有限也可以是无穷小的)。从量纲上,任意相空间坐标的函数 GG 都可以作为生成元,而生成函数 FF 的量纲则一定是作用量的量纲。对于无穷小正则变换,通常采用的都是生成元方法。一个自然的问题是,无穷小正则变换的生成函数是什么?在例 15.4 中知道,恒等变换的第 2 型生成函数为 F2=qaPaF_2=q^aP_a ,因此无穷小正则变换的第 2 型生成函数具有形式

F2=qaPa+ϵW(t,q,P)(15.48)F_2=q^aP_a+\epsilon W(t,\boldsymbol q,\boldsymbol P)\tag{15.48}

其中 ϵ\epsilon 为无穷小参数。无穷小正则变换即

pa=F2qa=Pa+ϵW(t,q,P)qa,Qa=F2Pa=qa+ϵW(t,q,P)Pa(15.49)p_a=\frac{\partial F_2}{\partial q^a}=P_a+\epsilon\frac{\partial W(t,\boldsymbol q,\boldsymbol P)}{\partial q^a},\quad Q^a=\frac{\partial F_2}{\partial P_a}=q^a+\epsilon\frac{\partial W(t,\boldsymbol q,\boldsymbol P)}{\partial P_a}\tag{15.49}

保留至 ϵ\epsilon 的线性阶,此时 WW 及其导数都可以在 {q,p}\{\boldsymbol q,\boldsymbol p\} 处取值,因此上式可以写成

δqaQaqa=ϵG(t,q,p)pa,δpaPapa=ϵG(t,q,p)qa(15.50)\delta q^a\equiv Q^a-q^a=\epsilon\frac{\partial G(t,\boldsymbol q,\boldsymbol p)}{\partial p_a},\quad \delta p_a\equiv P_a-p_a=-\epsilon\frac{\partial G(t,\boldsymbol q,\boldsymbol p)}{\partial q^a}\tag{15.50}

其中 G(t,q,p)=limϵ0W(t,q,P)G(t,\boldsymbol q,\boldsymbol p)=\lim_{\epsilon\to 0}W(t,\boldsymbol q,\boldsymbol P) 。这里的 GG 正是无穷小正则变换的生成元。

15.4.2 演化即是正则变换

​ 根据哈密顿正则方程

dξα(t)dt=ωαβHξβ=[ξα,H]XHα(15.51)\frac{\mathrm d\xi^\alpha(t)}{\mathrm dt}=\omega^{\alpha\beta}\frac{\partial H}{\partial \xi^\beta}=[\xi^\alpha,H]\equiv X^\alpha_H\tag{15.51}

可以得到一个重要的结论:时间演化是一种正则变换。

​ 哈密顿力学再次揭示了哈密顿量和时间的深刻联系。由此也可以理解,为什么相空间坐标 ξα(t)\xi^\alpha(t) 都是时间的函数,但是基本泊松括号 [ξα(t),ξβ(t)]=ωαβ[\xi^\alpha(t),\xi^\beta(t)]=\omega^{\alpha\beta} 却可以一直保持;也可以解释为什么无穷小正则变换条件式与判断方程是否为哈密顿正则方程的条件式完全一致。因为时间演化就是正则变换,而哈密顿正则方程实际就是无穷小正则变换的具体形式。时间演化本是物理系统的动力学行为,现在却成了一个叫做哈密顿量的函数所生成的相空间坐标变换。在这里,物理和数学的界限似乎变得很模糊。而这也正印证了:哈密顿力学是相空间中的几何学。

15.4.3 对称性与生成元

​ 在函数 GG 所生成的无穷小正则变换下,力学量 ff 的变换为

δff(λ+ϵ)f(λ)=fξαδξα=ϵfξα[ξα,G](15.52)\delta f\equiv f(\lambda+\epsilon)-f(\lambda)=\frac{\partial f}{\partial \xi^\alpha}\delta\xi^\alpha=\epsilon\frac{\partial f}{\partial \xi^\alpha}[\xi^\alpha,G]\tag{15.52}

其中 f(λ)f(ξ(λ))f(\lambda)\equiv f(\boldsymbol \xi(\lambda)) 。上式可以写成

δf=ϵ[f,G](15.53)\delta f=\epsilon [f,G]\tag{15.53}

​ 考虑相空间上的函数 GG,假设其不显含时间,并且与哈密顿量对易,即

[G,H]=0(15.54)[G,H]=0\tag{15.54}

这个式子可以从两个角度解读:

​ (1)δHG=0\delta_H G=0 ,即视为 GGHH 所生成的无穷小正则变换下不变。因为哈密顿量 HH 生成时间演化,这无法就是说力学量 GG 在时间演化下不变,即是运动常数。

​ (2)δGH=0\delta_GH=0 ,即视为 HHGG 所生成的无穷小正则变换下不败你。因为哈密顿量包含了系统的全部动力学信息,因此哈密顿量 HH 不变,则意味着 GG 生成的无穷小正则变换是系统的对称性。

​ 因此我们得到重要结论,对于不显含时间的力学量 GG

G是运动常数    G是对称变换的生成元(15.55)G 是运动常数\iff G是对称变换的生成元\tag{15.55}

补充

A.非惯性系

​ 拉格朗日方程的坐标变化不变性可以被用以方便地讨论非惯性系中的问题。

A.1 加速参考系

​ 设参考系 (x,y,z)(x',y',z') 相对于惯性系 (x,y,z)(x,y,z) 做加速运动而没有转动。设 r(t)\vec r(t)R(t)\vec R(t)r(t)\vec{r}'(t) 分别是质点在惯性系中、非惯性系坐标原点在惯性系中、质点在非惯性系中的位置矢量。易知

r(t)=R(t)+r(t)(A.1)\vec r(t)=\vec R(t)+\vec r'(t) \tag{A.1}

对时间 tt 求导

r˙(t)=R˙(t)+r˙(t)(A.2)\dot {\vec{r}}(t)=\dot{\vec R}(t)+\dot{\vec r'}(t) \tag{A.2}

​ 在惯性系中,系统的拉格朗日量为

L(ri,ri˙,t)=12miri˙2V(ri,t)(A.3)L(\vec{ r_i},\dot{\vec {r_i}},t)=\frac 12m_i\dot{\vec {r_i}}^2-V(\vec{r_i},t) \tag{A.3}

利用式(A.2),有

L(ri,ri˙,t)=12mi(R˙(t)+ri˙(t))2Vi(R(t)+ri(t),t)=12miri˙2+miri˙R˙(t)+12miR˙2(t)Vi(R(t)+ri(t),t)(A.4)\begin{aligned} L'(\vec{r_i}',\dot{\vec{r_i}}',t)&=\frac 12m_i\left(\dot{\vec R}(t)+\dot{\vec{r_i}}'(t) \right)^2-V_i\left(\vec R(t)+\vec{r_i}'(t),t \right) \\ &=\frac 12m_i\dot{\vec{r_i}}'^2+m_i\dot{\vec r_i}'\cdot\dot{\vec R}(t)+\frac 12m_i \dot{\vec R}^2(t)-V_i\left(\vec R(t)+\vec{r_i}'(t),t \right) \end{aligned}\tag{A.4}

​ 利用拉格朗日方程

ddtLri˙Lr=0(A.5)\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot{\vec{r_i}}'}-\frac{\partial L}{\partial \vec r'}=0\tag{A.5}

得到

miri¨=miR¨Viri(A.6)m_i\ddot{\vec{r_i}}'=-m_i\ddot{\vec R}-\frac{\partial V_i}{\partial \vec{r_i}'}\tag{A.6}

​ 对于式(A.4),有

L(ri,ri˙,t)=12miri˙2miriR¨(t)+12miR˙2(t)Vi(R(t)+ri(t),t)+ddt(miriR˙(t))(A.7)\begin{aligned} L'(\vec{r_i}',\dot{\vec{r_i}}',t)&=\frac 12m_i\dot{\vec{r_i}}'^2-m_i{\vec r_i}'\cdot\ddot{\vec R}(t)+\frac 12m_i \dot{\vec R}^2(t)-V_i\left(\vec R(t)+\vec{r_i}'(t),t \right)+\frac{\mathrm d}{\mathrm dt}\left(m_i\vec{r_i}'\cdot\dot{\vec R}(t) \right) \end{aligned}\tag{A.7}

忽略边界项,可以定义有效势能

Veffi(ri(t),t)=Vi+miriR¨(t)12miR˙2(t)(A.8)V_{eff_i}(\vec{r_i}'(t),t)=V_i+m_i\vec{r_i}'\cdot\ddot{\vec R}(t)-\frac 12m_i\dot{\vec R}^2(t) \tag{A.8}

得到

L(ri,ri˙,t)=12miri˙2Veffi(ri(t),t)(A.9)\begin{aligned} L'(\vec{r_i}',\dot{\vec{r_i}}',t)&=\frac 12m_i\dot{\vec{r_i}}'^2-V_{eff_i}\left(\vec{r_i}'(t),t \right) \end{aligned}\tag{A.9}

L(r,r˙,t)L(\vec r,\dot{\vec r},t) 具有相同的形式。

A.2 转动参考系

​ 简单起见,仅考虑单质点,无相对平动的情况。设 r\vec rr\vec r' 分别是质点在惯性系和非惯性系中的位置矢量,则有

r=R(t)r(A.10)\vec r=\mathbf R(t)\vec r' \tag{A.10}

对时间求导,得到

r˙=R(t)r˙+R˙(t)r(A.11)\dot{\vec r}=\mathbf R(t)\dot{\vec r}’+\dot{\mathbf R}(t)\vec{r}'\tag{A.11}

下面我们来化简第二项 R˙(t)r\dot{\mathbf R}(t)\vec r' 。将等式 RT(t)R(t)=I\mathbf R^T(t)\mathbf R(t)=\mathbf I 对时间求导,得

R˙T(t)R(t)+RT(t)R˙(t)=0(A.11)\dot{\mathbf R}^T(t)\mathbf R(t)+\mathbf R^T(t)\dot{\mathbf R}(t)=0 \tag{A.11}

(RT(t)R˙(t))T=R˙T(t)R(t)\left(\mathbf R^T(t)\dot{\mathbf R}(t)\right)^T=\dot{\mathbf R}^T(t)\mathbf R(t) ,定义三阶反对称矩阵

Ω=(0ω3ω2ω30ω1ω2ω10)(A.12)\mathbf\Omega= \begin{pmatrix} 0& -\omega_3 &\omega_2\\ \omega_3 & 0& -\omega_1\\ -\omega_2 & \omega_1 & 0 \end{pmatrix}\tag{A.12}

Ω=RTR˙R˙=RΩ(A.13)\mathbf\Omega=\mathbf R^T\dot{\mathbf R}\quad \Rightarrow \quad \dot{\mathbf R}=\mathbf R\mathbf \Omega\tag{A.13}

所以

r˙=R(t)(r˙(t)+Ω(t)r(t))=R(t)(r˙(t)+ω(t)×r(t))(A.14)\dot{\vec r}=\mathbf R(t)\left(\dot{\vec r}'(t)+\mathbf\Omega(t) \vec r'(t) \right)=\mathbf R(t)\left(\dot{\vec r}'(t)+\vec \omega(t)\times\vec{r}'(t) \right) \tag{A.14}

其中 ω=(ω1,ω2,ω3)\vec{\omega}=(\omega_1,\omega_2,\omega_3)

​ 惯性参考系中的拉格朗日量为

L(r,r˙,t)=12mr˙2V(r,t)(A.15)L(\vec r,\dot{\vec r},t)=\frac 12m\dot{\vec r}^2-V(\vec r,t)\tag{A.15}

代入式(A.14)得

L(r,r˙,t)=12m[R(t)(r˙+ω×r)]2V(r,t)=12mr˙2+mr˙(ω×r)+12m(ω×r)2V(r,t)(A.16)\begin{aligned} L'(\vec r,\dot{\vec r},t)&=\frac 12m\left[\mathbf R(t)\left(\dot{\vec r}'+\vec \omega\times\vec{r}' \right) \right]^2-V(\vec r',t)\\ &=\frac 12m\dot{\vec r}'^2+m\dot{\vec r}'\cdot(\vec \omega\times\vec r')+\frac 12m(\vec \omega\times\vec r')^2-V(\vec r',t) \end{aligned}\tag{A.16}

对于的拉格朗日方程为

ddtLr˙Lr=0(A.17)\frac{\mathrm d}{\mathrm dt}\frac{\partial L'}{\partial \dot{\vec r'}}-\frac{\partial L'}{\partial \vec r'}=0\tag{A.17}

其中

Lr=mω×r˙mω×(ω×r)Vr\frac{\partial L'}{\partial \vec r'}=-m\vec \omega\times\dot{\vec r}'-m\vec\omega\times(\vec \omega\times\vec r')-\frac{\partial V}{\partial \vec r'}

ddtLr˙=ddt(mr˙+mω×r)=mr¨+mω˙×r+mω×r˙\frac{\mathrm d}{\mathrm dt}\frac{\partial L'}{\partial\dot{\vec r}'}=\frac{\mathrm d}{\mathrm dt}\left(m\dot{\vec r}'+m\vec \omega\times\vec r' \right)=m\ddot{\vec r}'+m\dot{\vec \omega}\times\vec r'+m\vec \omega\times\dot{\vec r}'

代入整理后得到

mr¨=mω˙×r2mω×r˙mω×(ω×r)rVm\ddot{\vec r}'=-m\dot{\vec \omega}\times\vec r'-2m\vec\omega\times\dot{\vec r}'-m\vec \omega\times(\vec \omega\times\vec r')-\nabla_{\vec r'}V

右式中的第二、三、四项分别对应科里奥利力、离心力、外力。